Hat jemand schon mal ein Buch eingescannt?

tastebin

InventarNr. #290621
Crew
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Ich teste und tüftel ja viel daran Bücher mit KI zum Hörbuch zu basteln. Jetzt habe ich ein sehr analoges Problem.
Das Buch meiner Wahl gibt es anscheinend nicht einmal als E-Book.
Da ging dann die Rechnerei los.
Zwei Seiten pro Scanvorgang bei 736 Seiten...😂💪
Gibte es Tools für sowas?
Achja, falls jemand wissen will was mein Buch der Wahl ist:
Dean Koontz - Der Wächter
Das hab ich jetzt 6 mal gelesen.🫣😂
 

KOLWE-X

...sucht das ONE PIECE
Registriert
23 August 2022
Beiträge
700
Erhaltene Likes
4.164
Das ist das gleiche Problem wie bei Mangas. Ich denke ums zerschneiden und per Dokumentenscanner (also Stapelverarbeitung) kommst du nicht drumherum, denn die andere Variante per Flachbettscanner will man sich denke ich nicht antun. Scann ist immer ne schei** schöne Arbeit :p
 
Kommentieren

tastebin

InventarNr. #290621
Crew
Themenstarter
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Ach, schau mal. Scheuklappen! Stimmt. An zerschneiden habe ich noch gar nicht gedacht.
 
Kommentieren

Master_3

Namhafter Pirat
Registriert
26 Februar 2024
Beiträge
350
Erhaltene Likes
683
Das wohl schnellste und einfachste:

Spiegelreflexkamera, Stativ, vernünftige Beleuchtung, jede Seite Abfotografieren, alle in Adobe Reader Pro zusammenführen, OCR drüber laufen lassen und Abfahrt - danach kurze Kontrolle ob alles richtig erkannt wurde.

Bitte, Anmelden oder Registrieren um die Links zu sehen!

F34VE7IFHJMNRPH.png


Wenn der Aufbau erstmal steht ist das echt schnell,vor allem wenn du am besten noch einen Funkauslöser hast.

So wird das übrigens auch (in professioneller Form) mit wichtigen alten Büchern gemacht.

scribe01.jpg
 
Kommentieren

borstel

Namhafter Pirat
Registriert
11 November 2023
Beiträge
55
Erhaltene Likes
181
Es soll Buchscanner mit Blätterfunktion geben. Mir hat mal letztes Jahr jemand den Tipp gegen, das es an den Unis Geräte gibt, die frei zugänglich sind. Habe es aber nicht probiert.
 
Kommentieren

tastebin

InventarNr. #290621
Crew
Themenstarter
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Zur Uni hab ich gute Kontakte. Hab da ein paar Jahre für Sicherheit gesorgt. Fragen schadet nicht 💪
 
Kommentieren

tastebin

InventarNr. #290621
Crew
Themenstarter
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Boah wie Scheisse ist das denn? Jetzt rufe ich gerade an, um nach den Scannern zu fragen. -Du warst schon länger nicht mehr hier oder??😂 Kann ja sein das wir sowas haben. Aber seit wir die Bibliothek wegen Asbest abgerissen haben, ist sämtlicher Kram irgendwo eingelagert bis der Neubau steht. Kannst dich ruhig mal öfter blicken lassen...😂
 
Kommentieren

notimp

Pirat
Registriert
25 Dezember 2024
Beiträge
13
Erhaltene Likes
16
Bücher vollständig in andere Sprachen zu übersetzen ist (zum Glück) noch nicht dort wo wirs haben wollten. :) Dennis Scheck bekäme einen Herzinfarkt. ;) (
Bitte, Anmelden oder Registrieren um die Links zu sehen!
) Was schwierig ist - kann hier nachgelesen werden:
Bitte, Anmelden oder Registrieren um die Links zu sehen!


Das erwähnte Buch ist bereits digital auf deutsch verfügbar. Trail hier:
Bitte, Anmelden oder Registrieren um die Links zu sehen!


Aber jetzt zur generellen Frage.

Die Antwort ist Flachbrett Scanner.

Wenn es sich nur um unter 10 Bücher handelt.

So aufwändig das Blättern ist. :) Einfach ein 40 Euro Kombigerät (die sind höher als dezidierte scanner und das ist angenehmer, dann ne Serie schauen, und drauflos scannen, es dauert nicht so lang, wie du denkst.).

Zielformat kann alles sein, darauf achten, dass es in graustufen oder Farbe aber nicht in schwarz/weiss gescannt wird, 300 dpi ist ausreichend. Wenn das Zielformat eine Bilddatei ist, empfielt sich die Weiterverarbeitung in Scantailor - die Perspektivkorrektur wird man dabei auch nicht brauchen, da Flachbrettscans perspektivisch korrekt sind. Aber fürs zuschneiden (masking) und ggf aufteilen von Doppelseiten ist es oft praktisch. Aber je nach OCR Software auch kein Muss.

Einfach ne AI nach der software im zusammenhang mit Buch scans fragen, sie ist schon älter.

Danach empfielt es sich imho immer noch mit Finereader (nicht Mac version) weiterzuarbeiten, da die ein gutes Feature hat um OCR Erkennungsfehler statistisch auszuweisen, dh - das sagt dir recht schnell falls Seiten missglückt sind. Wenn du das manuell machen kannst, pfeif auf die Software, und geh direct in eine OCR AI wie Mistral, oder Deepseek rein. Die haben ne höhere Erkennungsgenauigkeit nahe am Falz - sagen dir aber nicht wo sie anfangen Wörter zu erfinden. (Geht hier um die Balance zur Scanqualität, die ist bei Flachbrettscannern meist hoch genug, dass mans machen kann.) (edit: Also, die AI sagens dir über die Metadaten statistisch schon, .. aber die APIs meist nicht... Wenn du da gräbst, bekommst du die Info vermutlich auch aus der dem LLM raus.... Sollte man eigentlich versuchen, ... :) )

Ideal wäre eigentlich ein AI Abgleich zu ner konventionell (Finereader) OCRten Variante -- aber die Tools sind wenn dann gebastelt.

Finereader alleine geht auch. Tutorial für regexes zum zusammenführen von Seiten findest du, wenn du meine Posting Historie durchgeshst (ich hab hier nicht viel gepostet, ist einfach. :) ).

Hier zum warum.

V-förmige scanner (abfotographieren), sind - wenn dus manuell machst beim blättern angenehmer, und zerstören den Buchrücken weniger. Um "perfekte" scanqualität zu haben, brauchst du aber nen keil der dir die fläche glättet (Glas, Plexiglas) - gute Ausleuchtung, eine ordentliche Kamera -- oder du verlässt die auf Perspektivkorrektur Software. Das ist dann ein extra Schritt. Die reduziert dir bei konventioneller OCR software wieder die Erkennungsgenauigkeit - und du wirst dich spielen um ein optimum zu bekommen.

Das Lohnt sich nicht für zehn Bücher.

Wenn du zur Uni gehst um zu scannen ("professionelle" Geräte) ist das Stehen und umblättern unangenehmer als zu Hause im Schneidersitz mit nem 40 Euro Scanner zu arbeiten.

Ist im Endeffekt daher oft langsamer. Schont aber den Buchrücken.

Die "Rollscanner" machen zu viel Aufwand (blättern, anpressen, Knopf drücken fertig ist da bereits ökonomischer).

Irgendwo da draußen existiert sicher auch ein cheapo Top Down scanner (so wie die V scanner vom Kamera Element her, aber mit einer günstigeren Kamera), der mit flacher Buchauflage (== dein Tisch) und mit software perspektiv Korrektur gute Resultate liefert. Das ist auch schnell (mein Röntgen Labor verwendet die im Kundenkontakt), und bei 300 dpi ausreichend - aber wie vergleichen, und einige davon sind Schrott.

Einfach nur Handy geht auch - und ist auch sehr schnell - macht aber deutlich am wenigsten Spass (krampfhafte Haltung) und du verlässt dich mehr auf OCR AI als mit jeder anderen Methode. (Tutorials siehe meine Posting Historie.)

Bei den AIs sei noch dazu gesagt, dass wenn du services nutzt (Deepseek OCR oder verglecihtbar ginge auch lokal bei dir am Rechner, da open source (open weights), wenn der beefy genug ist) -- deren Mitarbeiter nicht sofort eine Anzeige einreichen werden, wenn du copyright verletzt, aber falls aus jedweden Gründen bei denen wer anfragt - liegt das Material bei denen, und sie gebens auch gerne an staatliche Stellen weiter.

Dh. nutze die Services (APIs) aber mit Bedacht.

Die Risikoabschätzung für die Privatperson, mit fünf Büchern ist recht einfach - ich äußere sie hier trotzdem nicht.

Tools.

briss zum zuschneiden von pdfs

ScanTailor für masking und zuschneiden von Bildern. (Für Perspektivkorrektur gibt es sicher schon besseres)

Perspektivkorrektur und "automagic" Bildbearbeitung (Fingerentfernung, aufhellen, Schatten entfernen, whitening, ...) hab ich bisher nur bei Handybildern nutzen müssen - da war CamScanner (chinesische Entwickler) sehr gut.

OCR AI, die dir dann Markdown rauswirft ist am einfachsten für die Weiterverarbeitung - Finereader braucht Kenntniss der Settings, siehe meine Postinghistorie, hab das in einem github beitrag nochmal abgeradelt, wenn du den liest, liest du das Richtige.

Flachbrettscanner, und konvetionelle OCR Software ist immer noch ein sehr guter weg.

Handyphotos, und OCR AI - ist definitiv schneller - aber die Fehlerkorrektur wird aufwändiger.

Für nen Mix, musst du erst recht wieder die konventionelle OCR Software lernen, ... :)

V scanner nur, wenn du das mit vielen Büchern machst, und dir die Buchrücken zu schade sind um sie durch aufdrücken zu beschädigen (je mehr du drückst, desto weniger Schatten, ...).

V scanner die automatisch blättern (Ansaugvorrichtung), sind meist sehr langsam.

Den letzten Stand den ich hab war dass das auch mit Fließband style (links rechts movement des gesamten Buchs) Konzept Aparaturen versucht wurde, und dass die gut waren, aber die niemand gekauft hat. Für die V scanner mit ansaug vorrichtung gabs bereits nen Markt.

Gute Ausleuchtung und damit die Notwendigkeit der Vscanner wurde durch die Entwicklungen im AI Umfeld immer weniger wichtig. Perspektivkorrektur macht mit OCR AI auch keine Probleme - bei konventioneller OCR suchst du wahrscheinlich noch nach "optimal settings".

Wenn du Nachforschen möchtest, wirf einen Blick auf teurere chinese vendor style tabletop scanner.

Oder informier dich wo die "auto blättern" Bastler grand stecken. :)

Bau keinen V Scanner für 10 Bücher -- auch mit viel Freude am Basteln.

Das sind so die Eckpunkte... :)

Bei 5 Büchern musst du auch noch nicht den Umgang mit Regex lernen um Seiten zusammenzu-

fügen, das kannst du auch manuell.

Falls du in meinen Tutorials über Empfehlungen zu alten Versionen von Sigil (epub Bearbeitung) stolperst, die haben den Vorteil, dass sie Regex suche und GUI (so sieht das epub aus, also WYSIWYG) editor noch in einem Vereinen. Neuere Sigil versionen, haben dann einfach die GUI Oberfläche "ausgelagert" und die nicht mehr integriert.

Für mich waren die alten Versionen immer praktischer, aber ich habe auch noch mit denen gelernt, und bin dann dabei geblieben.

edit: Das Projekt von Master 3 schaut auch gut aus - aber. Bei Taschenbüchern stoßen diese Tabletop scanner ohne Perspektivkorrektur schnell an Grenzen. Die legst du nicht so einfach flach auf einen Tisch. Die wölben sich gerne. Und das produziert Schatten am Falz. Und der Whitespace dort ist nicht immer optimal groß. Das läuft mit Andruck auf nen Flachbrettscanner besser (verletzt aber die Buchbindung mehr).

Dennoch diese Tabletop scanner sind die Empfelung wenn du versuchst was gutes, dezidiertes (11+ Bücher ;) ) zu finden. Wenn du den Sweetspot bei denen findest (inkl Perspektivkorrektur) - sind sie sie sicher der beste Kompromiss.
 
Zuletzt bearbeitet:
Kommentieren

Linksnap

Pirat
Registriert
8 Mai 2021
Beiträge
18
Erhaltene Likes
21
Wenn es dir nicht um den meditativen Akt des digitalisieren geht, dann schau doch mal auf Open slum 2.0 vorbei, dort wirst du sicherlich fündig.
 
Kommentieren

Punx

Namhafter Pirat
Registriert
15 April 2023
Beiträge
351
Erhaltene Likes
709
Kommentieren

tastebin

InventarNr. #290621
Crew
Themenstarter
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Ich werde bescheuert. Da schüttelt er das einfach aus dem Ärmel.😱😮 Danke.🥳
 
Kommentieren

notimp

Pirat
Registriert
25 Dezember 2024
Beiträge
13
Erhaltene Likes
16
Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Das dürfte nichts werden. :)

1. Warum nicht pdf? Pdf ist so kompatibel!

Pdf ist ein Bild oder vektorbasiertes Rasterformat, erfunden für die Standardisierung einer Datei für Display-Publishing Wiedergabe und Druck.

Eine pdf weiss nicht was Text ist - sie kennt nur Linien (Lines) in einem x/y Raster. Sie hat keine Ahnung von Überschriften, weiss nicht was ein Absatz ist weiß nicht was ein Abstand zwischen Abätzen ist (whitespace, oder newline - kennt keines davon), weiß nicht was eine Seite ist, ...

Aber fürs Büro reichts. Wenn ich Ratschläger auf dem Niveau einer Büro-Fachkraft hören will schlag ich mir zuerst dreimal ins Gesicht und geh dann auf ein Amt.

2. Also nachdem wir etabliert haben, warum Amazon und andere Unternehmen für eReading nicht pdf verwenden - du kriegst aber Text aus pdfs raus! Schau meine Handy app kann OCR!

*ramm mir die Faust in den Mund um nicht laut drauf los zu schrein*

Ja. Eh.

Es gibt dabei nur drei kleine Probleme.

Um mit Handyphotos eBooks zu OCRen - brauchst du AIs auf dem Level von "läuft auf ner RTX 3090" - du kriegst Modelle wie Mistral OCR, oder Deepseek OCR aktuell auf keinem Smartphone der Welt, ...

Warum brauchst du diese Modelle? Da du selbst nach descewing und Schattenentfernung, und Farbanpassung, bei Smartphone photos nur eine Qualität erreichst - die nicht gut genug ist um 300 Laufseiten in Bulk zu bearbeiten, ohne jede zweite Seite Nachzuarbeiten.

Wenn du oben liest "geht mit OCR AI - da die Wörter nahe dem gebogenen Falz besser erkennt" -- dann ist deine Reaktion daraug bitte nicht -- boah, ey der Marketing Waschzettel meiner MASCH DICH DIE PDFS SELBST App sagt, die auch kann OCR.

Im Idealfall.

Kommen wir zum zweiten der drei kleinen Probleme. Für den Fall, dass eine Fehlerkennung im OCR vorliegt also nur mal so eventuell - willst du die am Smartphone mit Wischen über 300 Seiten Buch korrigieren. Wo der Screen nicht mal breit genug ist, damit du das 1:1 Buch Layout zum OCRten Text dargestellt bekommst?

Ja schon oder? Das Marketing hat dir ja erklärt DU schaffst das. Du hast ja Android Tablet.

Was uns zu dem dritten kleinen Problem bringt - Seitenumbrüche.

Also wenn du so einen schönen Text hast, wie - Ich bin im Leben auf den Niveau geblie-
ben, dass ich es toll fand, dass meine Volksschullehrerin uns damals dazu animiert hat unsere
schönste Sommergeschichte über die Ferien hinweg in einen zweiseitiges Essay zu ver-
schriftlichen und ihr dann zum Lesen zu überreichen, worauf wir Sticker bekamen. Meine
waren immer mit so Glitzer drauf, die waren voll schön, so wie meine tolle Sommergeschich-
te. Meine war die bester der Klasse, so mit Apps und so.

Während die Silbentrennungen hier mit guter OCR software bereits wieder in volle Worte kondensiert werden, da es bei OCR um Text Extraction und weniger um das Exakte layout geht - etwas, was deine Handy app zu 99% nicht beherrscht -- stößt die Handyapp unter Garantie auf Probleme, wenn sich die Silbentrennungen zwischen zwei Seiten befinden. Da du das in PDF garnicht konzeptualisiert bekommst, dass auf zwei Seiten - ein Wort, getrennt zu finden ist.

Dh - du haust nen OCR Layer über ne pdf drüber - der weit, weit, weit schlechter ist als eine Textdate (erneut, pdfs kennen nur Linien mit x/y Koordinaten, nicht was'n Absatz ist, oder ne Lehrzeile, ...), der dann auf jeder fünften seite, ein halbes Wort am Ende des Textblocks hat.

PERFEKT FÜR Text to Speech AIS!

Hier werden sie noch geholfen.

Letzter Paragraph. In bins gewohnt, dass in in nen Raum geh - und rund um mich nur Leute habe die, ... Ok, schlechter Anfang, neuer Versuch.

Wenn man hier schreibt, das Buch existiert bereits Digital. Und nen Verweis setzt, kommt der nächsten Forenuser und sagt, unter meinem Link gibts das aber Digital. Kommt der nächste Foren User und sagt, unter meinem Link gibts das aber Digital in einem andern Format.

Ich find das Super -- das führt dir noch so plastisch vor Augen, dass sinnerfassendes Lesen, im heutigen Service-Internet wirklich zu einem rein optionalen Extra geworden ist.

Danke - Vorhang, bitte.

(Falls ich irgendwo eine Netiquette Regel übersehen habe, sue me - not my Generation that needed those. In life.)
Beitrag automatisch zusammengeführt:

Bitte, Anmelden oder Registrieren um den Inhalt zu sehen!
Wenn du den beiden Links davor gefolgt wärest, von mir, und einem anderen Poster nach mir - was du nicht gemacht hast - weil frag mich nicht, hättest dus bereits in nem Format (epub, dh html basiert) mit dem deine TTS software was anfangen kann.

Ich sags ja nur...

Das braucht schon seine drei Tage um einzusickern.

Crewmitglied.

Aber es war halt einfach nicht personalisiert genug. Da konnt man nicht vom Smartphone aus mit smilies reagieren.

Ich hoffe, dass das auch die Industrie Mitarbeiter die hier mitlesen so sehen, und nicht versehentlich über das größte internet Library Projekt der Dekade stolpern, ich mein, man stell sich vor - die schaffen das einfach nicht - wie, Crewmitglied.

Eine wohlige Vorstellung die mir Hoffnung macht, dass da Projekt auch noch die nächsten fünf Jahre überlebt.
 
Zuletzt bearbeitet:
Kommentieren

tastebin

InventarNr. #290621
Crew
Themenstarter
Registriert
29 Juni 2021
Beiträge
3.463
Erhaltene Likes
8.080
Also ich kann dir gar nicht sagen was bei dir gerade alles daneben ist. Ich aber das hier nicht weiter verfolgen können weil wir gerade meine Schwiegermutter ins Altenheim bringen mussten, ich mir bei der Wohnungsauflösung nen Bandscheibenvorfall zugezogen habe etc.usw.
Aber eigentlich ist es auch egal.
Zickst du hier gerade rum weil dir dein Applaus verwehrt blieb?

Also in Sachen Netiquette: Prima gelaufen.
 
Kommentieren

Master_3

Namhafter Pirat
Registriert
26 Februar 2024
Beiträge
350
Erhaltene Likes
683
@notimp ich habe den Eindruck du schreibst gerne in Form, Länge und mit hohem Floskelanteil einfach nur um erschlagend zu wirken....das lässt vielleicht den Ottonormal Leser abschrecken...

Die verlinkte PDF von @Punx habe ich eben mal durch das OCR von Adobe Reader Pro gejagt, ging ohne Probleme in kurzer Zeit. Mal abegesehn davon dass die PDF im Online Read sogar bereits mit OCR versehen ist und der Text so kopierbar ist....

In Tastebins Fall ging es doch erstmal darum ÜBERHAUPT an ein digitales Exemplar zu kommen, sei es via einem der großen Archive, oder via Eigenerstellung. Der zweite Step, TTS, ist da wesentlich einfacher und erst notwendig, wenn der erste abgearbeitet ist.
 
Kommentieren

Punx

Namhafter Pirat
Registriert
15 April 2023
Beiträge
351
Erhaltene Likes
709
1.Handy Nehmen
2.Scanner App Verwenden
3. als PDF «oder» sonstiges Speichern
4. OCR Software nehmen, Datei lesen.
5. Fertig

PS: Das kann ja sogar schon mein SNAGIT aus ’nem BILD extrahieren, also heutzutage keine Raketenwissenschaft.
 
Kommentieren
Duckier

Sicher & Gratis VPN

Schütze deine Privatsphäre mit Duckier VPN — schnell, gratis und ohne Logs.

BlitzschnellKeine Geschwindigkeitslimits, kein Drosseln
Keine LogsDeine Aktivitäten bleiben privat — immer
Globales NetzwerkServer weltweit für beste Performance
100% KostenlosKeine Kreditkarte, keine versteckten Kosten
Oben