Teksto-agnosko. Senpaga programo - analoga al FineReader

Pin
Send
Share
Send

Pli frue aŭ pli frue, ĉiuj, kiuj ofte laboras kun oficejaj programoj, alfrontas tipan taskon - skani tekston el libro, revuo, gazeto, nur flugfolioj, kaj poste traduki ĉi tiujn bildojn en teksta formato, ekzemple, en Vortan dokumenton.

Por fari tion, vi bezonas skanilon kaj specialan programon por rekoni tekston. Ĉi tiu artikolo diskutos la senpagan ekvivalenton de FineReader -Kuneoforma (pri agnosko en FineReader - vidu ĉi tiun artikolon).

Ni komencu ...

Enhavo

  • 1. Trajtoj de la programo CuneiForm, trajtoj
  • 2. Ekzemplo de teksta agnosko
  • 3. Loka teksto-agnosko
  • 4. Konkludoj

1. Trajtoj de la programo CuneiForm, trajtoj

Kuneoforma

Vi povas elŝuti ĝin de la retejo de la programisto: //cognitiveforms.com/

Malferma fonta teksta agnoska programo. Krome ĝi funkcias en ĉiuj versioj de Vindozo: XP, Vista, 7, 8, kio plaĉas. Plie, aldonu la plenan rusan tradukon de la programo!

Pros:

- teksta agnosko en la 20 plej popularaj lingvoj de la mondo (la angla kaj la rusa per si mem estas inkluzivitaj en ĉi tiu numero);

- Grandega subteno por diversaj presaj tiparoj;

- kontrolu la vortaron de rekonita teksto;

- la kapablo ŝpari laborrezultojn de pluraj manieroj;

- konservado de la strukturo de la dokumento;

- Bonega subteno kaj tablo-agnosko.

Avantaĝoj:

- ne subtenas tro grandajn dokumentojn kaj dosierojn (pli ol 400 dpi);

- Ne rekte subtenas iujn specojn de skaniloj (nu, ĝi ne estas granda afero, speciala skanila programo estas inkluzivita kun la skanaj ŝoforoj);

- la dezajno ne brilas (sed kiu bezonas ĝin se la programo plene solvas la problemon).

2. Ekzemplo de teksta agnosko

Ni supozas, ke vi jam ricevis la necesajn bildojn por rekono (skanita tie, aŭ elŝutis libron en formato pdf / djvu en la interreto kaj forigis de ili la necesajn bildojn. Por kiel fari tion, vidu ĉi tiun artikolon).

1) Malfermu la deziratan bildon en la programo CuineForm (dosiero / malfermita aŭ "Cntrl + O").

2) Por komenci agnoskon - vi devas unue elekti diversajn areojn: teksto, bildoj, tabloj, ktp. En la programo Cuneiform, tio eblas nur ne permane, sed ankaŭ aŭtomate! Por fari tion, alklaku la butonon "aranĝo" en la supra panelo de la fenestro.

3) Post 10-15 sekundoj. La programo aŭtomate resaltos ĉiujn areojn kun malsamaj koloroj. Ekzemple, teksta areo estas reliefigita en bluo. Parenteze, ŝi emfazis ĉiujn areojn ĝuste kaj sufiĉe rapide. Sincere, mi ne atendis tiel rapidan kaj ĝustan reagon de ŝi ...

4) Por tiuj, kiuj ne fidas la aŭtomatan aranĝon, vi povas uzi manlibron. Por tio, ekzistas ilobreto (vidu la bildon sube), danke al kiu vi povas elekti: teksto, tablo, bildo. Movu, pligrandigu / reduktu la komencan bildon, kroĉu la randojn. Ĝenerale, bona aro.

5) Post kiam ĉiuj areoj estis markitaj, ni povas procedi al agnosko. Por fari tion, simple alklaku la butonon kun la sama nomo, kiel en la bildo sube.

6) Laŭvorte en 10-20 sekundoj. Vi vidos dokumenton en Microsoft Word kun rekonita teksto. Interese, ke en la teksto por ĉi tiu ekzemplo kompreneble estis eraroj, sed tre malmultaj el ili! Plie, konsiderante en kia senprepara kvalito estis la fontomaterialo - bildo.

La rapideco kaj kvalito estas sufiĉe kompareblaj al FineReader!

3. Loka teksto-agnosko

Ĉi tiu programfunkcio povas esti utila kiam vi bezonas rekoni ne unu bildon, sed kelkajn samtempe. La ŝparvojo por komenci batch-rekonon estas kutime kaŝita en la komenca menuo.

1) Post malfermo de la programo, vi devas krei novan pakaĵon, aŭ malfermi antaŭe konservitan. En nia ekzemplo kreu novan.

2) En la sekva paŝo ni donas al ĝi nomon, preferinde, kiu memoras tion, kio estas konservita en ĝi ses monatojn poste.

3) Poste elektu la dokumentan lingvon (rusan-anglan), indiku, ĉu estas bildoj kaj tabloj en via skanita materialo.

4) Nun vi devas precizigi la dosierujon, en kiu troviĝas la dosieroj por agnosko. Parenteze, kio estas interesa, la programo mem trovos ĉiujn bildojn kaj aliajn grafikajn dosierojn, kiujn ĝi povas rekoni kaj aldoni al la projekto. Vi nur devas forigi la kroman.

5) La sekva paŝo ne gravas - elektu kion fari kun la fontdosieroj, post rekono. Mi rekomendas ke vi elektu la markobutonon "faru nenion".

6) Restas nur elekti la formaton en kiu la konservita dokumento estos konservita. Estas pluraj ebloj:

- rtf - dosiero el vorta dokumento, malfermita de ĉiuj popularaj oficejoj (inkluzive liberajn, ligon al programoj);

- txt - formato de teksto, vi povas konservi nur tekston en ĝi, bildoj kaj tabloj ne eblas;

- htm - hiperteksta paĝo, konvena se vi skanas kaj rekonas dosierojn por la retejo. Ni elektos ĝin laŭ nia ekzemplo.

7) Post alklakado de la butono "Fini", la procezo de pretigo de via projekto komenciĝos.

8) La programo funkcias sufiĉe rapide. Post agnosko, langeto kun htm-dosieroj aperos antaŭ vi. Se vi alklakas tian dosieron, foliumilo komenciĝas, kie vi povas vidi la rezultojn. Parenteze, la pakaĵo povas esti konservita por plua laboro kun ĝi.

9) Kiel vi povas vidi, la rezultoj la laboro estas tre impresa. La programo facile rekonis la bildon, kaj sub ĝi la teksto facile rekonis. Malgraŭ la fakto, ke la programo estas senpaga, ĝi ĝenerale bonas!

4. Konkludoj

Se vi ofte ne skanas kaj rekonas dokumentojn, tiam aĉeti la programon FineReader probable ne havas sencon. Plej multaj taskoj estas facile pritraktataj de CuneiForm.

Aliflanke ŝi ankaŭ havas malavantaĝojn.

Unue estas tro malmultaj iloj por redakti kaj kontroli la rezulton. Due, kiam vi devas rekoni multajn bildojn, estas pli oportune en FineReader vidi tuj ĉion aldonitan al la projekto en la kolumno dekstre: rapide forigi nenecesajn, fari korektojn ktp. Kaj trie, CuneiForm perdas kiel agnosko sur dokumentoj: Mi devas atentigi la dokumenton - redakti erarojn, meti interpunkciojn, citilojn, ktp.

Jen ĉio. Ĉu vi konas iun alian dignan senpagan tekston-agnoskon?

Pin
Send
Share
Send