Scan lan pangenalan teks

Pin
Send
Share
Send

Sugeng sonten

Mbok, saben kita ngadhepi tugas kasebut nalika kudu nerjemahake dokumen kertas dadi wujud elektronik. Iki pancen penting banget kanggo wong sing sinau, nggarap dokumentasi, nerjemahake teks nggunakake kamus elektronik, lsp.

Ing artikel iki, aku kepengin nuduhake sawetara dhasar proses iki. Umumé, mindhai lan ngenali teks cukup akeh wektu, amarga umume operasi kudu ditindakake kanthi manual. Kita bakal nyoba mangertos apa, kepiye, lan kenapa.

Ora kabeh wong langsung ngerti siji perkara. Sawise mindhai (pas kabeh lembar ing scanner) sampeyan bakal duwe gambar ing format BMP, JPG, PNG, GIF (bisa uga ana format liyane). Dadi, saka gambar iki sampeyan kudu entuk teks - prosedur iki diarani pangenalan. Ing tatanan iki bakal dadi pratelan ing ngisor iki.

Isi

  • 1. Apa sing dibutuhake kanggo mindhai lan ngenali?
  • 2. Pilihan pindai teks
  • 3. Pangenalan teks dokumen
    • 3.1 Teks
    • 3.2 Gambar
    • 3.3 Tabel
    • 3.4 Barang sing ora perlu
  • 4. Pangenalan file PDF / DJVU
  • 5. Priksa kesalahan lan nylametake asil karya

1. Apa sing dibutuhake kanggo mindhai lan ngenali?

1) Scanner

Kanggo ngowahi dokumen sing dicithak dadi teks, luwih dhisik sampeyan kudu scanner lan, miturut "program" pribumi "lan driver sing melu. Nggunakake, sampeyan bisa mindhai dokumen lan nyimpen kanggo diproses luwih.

Sampeyan bisa nggunakake analog liyane, nanging piranti lunak sing teka karo scanner ing kit biasane bisa luwih cepet lan luwih akeh pilihan.

Gumantung saka apa scanner sing sampeyan duwe, kacepetan kerja bisa beda-beda kanthi signifikan. Ana scanner sing bisa nampa gambar saka lembar ing 10 detik, ana sing bakal nampa sajrone 30 detik. Yen sampeyan mindhai buku kanggo 200-300 lembar - aku rumangsa ora angel ngétung pira bakal ana bedane wektu?

 

2) Program pangenalan

Ing artikel kita, aku bakal nuduhake karya ing salah sawijining program sing paling apik kanggo mindhai lan ngenali dokumen apa wae - ABBYY FineReader. Amarga Wiwit program kasebut dibayar, aku bakal langsung menehi link - liyane saka Cunei Formulir. Bener, aku ora bakal mbandhingake, amarga kasunyatan manawa FineReader menang ing kabeh aspek, aku isih menehi saran nyoba.

ABBYY FineReader 11

Situs web resmi: //www.abbyy.ru/

Salah sawijining program paling apik. Iki dirancang kanggo ngenali teks ing gambar kasebut. Pilihan lan fungsi akeh. Iki bisa ngatasi pirang-pirang fon, malah ndhukung pilihan tulisan tangan (sanajan aku durung nyoba, mula aku ora ngerteni versi tulisan tangan, kajaba sampeyan duwe tulisan tulisan kaligrafi). Rincian liyane babagan nggarap iku bakal diterangake ing ngisor iki. Ing kene kita uga nyathet artikel kasebut bakal ngomong babagan nggarap program versi 11.

Minangka aturan, macem-macem versi ABBYY FineReader ora beda banget karo saben liyane. Sampeyan bisa kanthi gampang nindakake perkara kasebut ing liyane. Bedane utama bisa uga kepenak, kecepatan program lan kapabilitase. Contone, versi sadurunge nolak mbukak PDF lan DJVU ...

 

3) Dokumen kanggo mindhai

Ya, kaya ngono, aku mutusake nggawe dokumen minangka kolom sing kapisah. Umume kasus, sawetara buku teks, koran, artikel, majalah, dll. buku-buku kasebut lan literatur sing dikarepake. Apa sing dituntun? Saka pengalaman pribadi, aku bisa ngerteni manawa sampeyan pengin scan bisa uga wis ana ing jaringan! Carane kakehan aku ngirit wektu nalika aku nemokake buku tartamtu sing wis mindhai jaringan. Apa sing dakkirim yaiku nyalin teks kasebut menyang dokumen kasebut lan terus digarap.

Saka iki, tip prasaja - sadurunge sampeyan mindhai priksa, priksa manawa ana wong sing wis mindhai lan sampeyan ora kudu mbuwang wektu.

 

2. Pilihan pindai teks

Ing kene aku ora bakal ngomong babagan driver sampeyan kanggo scanner, program sing digarap, amarga kabeh model scanner beda, piranti lunak uga beda-beda nang endi wae, lan ora realistis kanggo ngira-ngira cara nindakake operasi kasebut.

Nanging kabeh scanner duwe setelan sing padha, sing bisa mengaruhi kacepetan lan kualitas karya sampeyan. Kita mung arep ngomong babagan iki. Aku bakal dhaptar kanthi urutan.

1) Kualitas pindai - DPI

Pisanan, atur kualitas scan ing opsi paling ora 300 DPI. Malah disaranake nyetel liyane yen bisa. Indikator DPI sing luwih dhuwur, gambar sampeyan bakal luwih jelas, lan mula, proses luwih cepet bakal luwih cepet. Kajaba iku, kualitas pindai sing luwih dhuwur, luwih murah sampeyan kudu mbenerake mengko.

Pilihan paling apik biasane nyedhiyakake 300-400 DPI.

 

2) Werna

Parameter iki mengaruhi wektu mindhai kanthi kuwat (kanthi cara, DPI uga mengaruhi, nanging sing kuat banget, lan mung nalika pangguna nyetel nilai sing dhuwur).

Biasane ana telung mode:

- ireng lan putih (sampurna kanggo teks kosong);

- abu-abu (cocog kanggo teks nganggo tabel lan gambar);

- warna (kanggo majalah warna, buku, umume, dokumen sing penting warna).

Biasane, wektu pindai gumantung pilihan warna. Pancen, yen sampeyan duwe dokumen gedhe, mula ekstra 5-10 detik ing kaca kanthi total bakal diwutahake kanthi wektu sing pantes ...

 

3) Foto

Sampeyan bisa entuk dokumen ora mung kanthi mindhai, nanging uga motret. Minangka aturan, ing kasus iki, sampeyan bakal duwe sawetara masalah liyane: distorsi gambar, blur. Amarga iki, panyuntingan lan pangolahan teks sing luwih suwe bisa dibutuhake. Secara pribadi, aku ora nyaranake nggunakake kamera kanggo bisnis iki.

Penting kanggo dicathet yen ora kabeh dokumen kasebut bisa dingerteni, amarga Kualitas scan bisa sithik ...

 

3. Pangenalan teks dokumen

Kita nganggep manawa sampeyan wis nampa kaca sing wis ditresnani. Paling asring minangka format: tif, bmb, jpg, png. Umumé, kanggo ABBYY FineReader - iki ora pati penting banget ...

Sawise mbukak gambar ing ABBYY FineReader, program kasebut, minangka aturan, kanthi otomatis milih wilayah lan ngenali ing mesin kasebut. Nanging kadang dheweke tumindak salah. Kanggo iki, kita bakal nimbang pilihan babagan wilayah sing dibutuhake kanthi manual.

Penting! Ora kabeh wong langsung ngerti yen sawise mbukak dokumen ing program kasebut, dokumen sumber ditampilake ing jendhela kiwa, sing sampeyan milih macem-macem wilayah. Sawise ngeklik tombol "pangenalan", program ing jendela ing sisih tengen bakal nampilake teks sing wis rampung. Sawise dingerteni, kanthi menehi saran kanggo mriksa teks kanggo kesalahan ing FineReader sing padha.

 

3.1 Teks

Wilayah iki digunakake kanggo nyorot teks. Gambar lan tabel kudu dilebokake. Langka lan font sing ora biasa kudu ngetik kanthi manual ...

Kanggo milih area teks, rungokake panel ing sisih ndhuwur FineReader. Ana tombol "T" (deleng gambar ing ngisor iki, pointer mouse ing tombol iki). Klik ing ngisor iki, banjur ing gambar ing ngisor iki, pilih area persegi kanthi rapi ing endi teks kasebut. Miturut cara, ing sawetara kasus, sampeyan kudu nggawe blok teks saka 2-3, lan kadhangkala 10-12 saben kaca, amarga format teks bisa beda lan siji persagi ora milih kabeh wilayah.

Penting kanggo elinga yen gambar ora kudu tiba ing wilayah teks! Ing ngarep, iki bakal nylametake sampeyan akeh wektu ...

3.2 Gambar

Digunakake kanggo nyorot gambar lan wilayah sing angel dikepengini amarga font sing ora apik utawa font sing ora biasa.

Ing gambar ing ngisor iki, pointer mouse dumunung ing tombol sing digunakake kanggo milih area "gambar". Kanthi cara iki, ing wilayah kasebut, sampeyan bisa milih bagean endi wae ing kaca kasebut, lan FineReader banjur nempatake menyang dokumen kasebut minangka gambaran normal. I.e. mung "bodho" salinan ...

Biasane wilayah iki digunakake kanggo nyorot tabel sing wis mentas kurang apik, kanggo nyorot teks lan font sing ora standar, kanthi gambar dhewe.

3.3 Tabel

Gambar ing ngisor iki nuduhake tombol kanggo tabel penting. Umumé, aku nggunakake arang banget. Kasunyatane sampeyan kudu rada nggambar (nyatane) saben baris ing meja lan nuduhake apa lan kepiye program. Yen meja cilik lan ora kualitas apik banget, aku nyaranake nggunakake "gambar" area kanggo tujuan kasebut. Mangkono, ngirit akeh wektu, lan tabel banjur bisa digawe kanthi cepet ing Word adhedhasar gambar kasebut.

 

3.4 Barang sing ora perlu

Penting, kudu diwenehi tandha. Kadhangkala ora ana unsur sing ora perlu ing kaca sing ngganggu pangenalan teks, utawa malah nyegah sampeyan nyorot wilayah sing dikarepake. Dheweke bisa dicopot kanthi nggunakake pambas.

Kanggo nindakake iki, pindhah menyang mode penyuntingan gambar.

 

 

Pilih alat pambusuk banjur pilih wilayah sing ora perlu. Bakal dipadamake lan kertas kertas putih bakal ana ing papane.

 

Miturut cara, aku menehi saran supaya sampeyan nggunakake pilihan iki kanthi cepet. Coba kabeh wilayah teks sing wis dipilih, ing ngendi sampeyan ora butuh potongan teks, utawa titik sing ora perlu, bledheg, distorsi wis ana - busak karo penghapus. Thanks kanggo iki, pangenalan bakal luwih cepet!

 

4. Pangenalan file PDF / DJVU

Umumé, format pangenalan iki ora bakal beda karo liyane - liyane. sampeyan bisa nggarap kaya gambar. Siji-sijine masalah kasebut yaiku program kasebut ora pati suwe yen file PDF / DJVU ora mbukak kanggo sampeyan - upgrade menyang versi 11.

 

A tip sethitik. Sawise mbukak dokumen ing FineReader - kanthi otomatis bakal miwiti ngenali dokumen kasebut. Asring ing file PDF / DJVU, area khusus kaca ora dibutuhake ing kabeh dokumen! Kanggo mbusak area kaya kasebut ing kabeh kaca, tindakake ing ngisor iki:

1. Menyang bagean suntingan gambar.

2. Nguripake pilihan "potong".

3. Pilih wilayah sing sampeyan pengin ing kabeh kaca.

4. Klik ditrapake kanggo kabeh kaca lan panen.

5. Priksa kesalahan lan nylametake asil karya

Mesthine bisa uga ana masalah nalika kabeh wilayah disorot, mula bisa dingerteni - jupuk lan simpen ... Ana kana!

Pisanan, sampeyan butuh priksa dokumen!

Kanggo ngaktifake, sawise dingerteni, ing jendhela ing sisih tengen, bakal ana "mriksa" tombol, deleng gambar ing ngisor iki. Sawise ngeklik, program FineReader kanthi otomatis bakal nuduhake sampeyan ing wilayah sing program kasebut duwe kesalahan lan ora bisa ngerteni karakter tartamtu. Sampeyan mung kudu milih, sampeyan setuju karo panemu program kasebut, utawa ketik karakter sampeyan.

Kanthi cara kasebut, ing separo kasus, kira-kira program kasebut bakal menehi sampeyan tembung sing wis siap - sampeyan mung kudu milih pilihan sing cocog karo mouse.

 

Kapindho, sawise mriksa, sampeyan kudu milih format sing wis disimpen ing asil karya.

Ing kene FineReader ngidini sampeyan ngowahi kanthi lengkap: sampeyan bisa mindhah informasi menyang Sabda siji, utawa sampeyan bisa nyimpen ing salah siji saka puluhan format. Nanging aku pengin nyorot aspek penting liyane. Apa format sing dipilih, luwih penting kanggo milih jinis salinan! Coba pilihan sing paling menarik ...

Salin eksplisit

Kabeh wilayah sing disorot ing kaca ing dokumen sing diakoni bakal cocog karo dokumen asli. Pilihan sing trep nalika penting sampeyan ora bakal kelangan format teks kasebut. Miturut cara, fon uga bakal padha karo sing asli. Kanthi pilihan iki, aku nyaranake ngirim dokumen kasebut menyang Word supaya karya luwih bisa terus ing kana.

Salin sing bisa diowahi

Pilihan iki apik kanggo entuk versi teks sing wis diformat. I.e. indhisi karo "kilometer", sing bisa uga ana ing dokumen sumber - sampeyan ora bakal ketemu. Pilihan sing migunani nalika sampeyan bakal ngowahi informasi kanthi signifikan.

Sejatine, sampeyan ora kudu milih yen sampeyan penting kanggo njaga gaya desain, fon, indents. Kadhangkala, yen pangenalan ora sukses, dokumen bisa "lutut" amarga format sing diganti. Ing kasus iki, luwih becik milih salinan sing tepat.

Tata teks

Pilihan kanggo sing mbutuhake teks mung saka kaca tanpa liya. Cocog kanggo dokumen tanpa gambar lan tabel.

 

Ing artikel iki babagan mindhai lan ngenali dokumen rampung. Muga-muga kanthi tips prasaja iki sampeyan bisa ngrampungake masalah sampeyan ...

Sugeng nyambut damel

Pin
Send
Share
Send