ഒരു PDF ഫയൽ ഓൺലൈനിൽ എങ്ങനെ തിരിച്ചറിയാം

പരമ്പരാഗത പകർപ്പെടുക്കൽ ഉപയോഗിച്ച് ഒരു PDF ഫയലിൽ നിന്നും ടെക്സ്റ്റ് എക്സ്ട്രാക്റ്റ് ചെയ്യാൻ എപ്പോഴും സാധ്യമല്ല. പലപ്പോഴും അത്തരം രേഖകളുടെ പേജുകൾ അവരുടെ പേപ്പർ പതിപ്പുകൾ സ്കാൻ ചെയ്ത ഉള്ളടക്കമാണ്. അത്തരം ഫയലുകൾ പൂർണ്ണമായി എഡിറ്റ് ചെയ്യാവുന്ന ടെക്സ്റ്റ് ഡാറ്റയായി മാറ്റാൻ, ഒപ്റ്റിക്കൽ പ്രതീക തിരിച്ചറിയൽ (OCR) ഫംഗ്ഷനുള്ള പ്രത്യേക പ്രോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു.

അത്തരം പരിഹാരങ്ങൾ നടപ്പിലാക്കാൻ വളരെ ബുദ്ധിമുട്ടാണ്, അതിനാൽ ധാരാളം പണം ചിലവാകും. പതിവായി PDF ഉപയോഗിച്ച് വാചകം തിരിച്ചറിയണമെങ്കിൽ ഉചിതമായ പ്രോഗ്രാം വാങ്ങുന്നതാണ് അഭികാമ്യം. അപൂർവ്വം കേസുകളിൽ, സമാനമായ പ്രവർത്തനങ്ങളോടൊപ്പം ലഭ്യമായ ഓൺലൈൻ സേവനങ്ങളിൽ ഒന്ന് ഉപയോഗിക്കുന്നതിന് കൂടുതൽ ലോജിക്കൽ ആകും.

PDF ഓൺലൈനിൽ നിന്ന് ടെക്സ്റ്റ് തിരിച്ചറിയാൻ എങ്ങനെ

തീർച്ചയായും, മുഴുവൻ പണിയിട പരിഹാരങ്ങളുമായി താരതമ്യം ചെയ്യുമ്പോൾ OCR ഓൺലൈൻ സേവന സവിശേഷത സവിശേഷത പരിമിതമാണ്. എന്നാൽ നിങ്ങൾക്ക് അത്തരം വിഭവങ്ങളുമായി സൌജന്യമായി, അല്ലെങ്കിൽ നാമമാത്രമായ ഫീസായി പ്രവർത്തിക്കാൻ കഴിയും. പ്രധാന കാര്യം അനുയോജ്യമായ വെബ് ആപ്ലിക്കേഷനുകൾ അവരുടെ പ്രധാന കടമ, അതായത് ടെക്സ്റ്റ് റെക്കഗ്നിഷൻ, നേരിടാൻ ആണ്.

രീതി 1: ABBYY ഫൈൻ റീഡർ ഓൺലൈനിൽ

ഒപ്റ്റിക് ഡോക്യുമെന്റ് റെക്കഗ്നൈസേഷന്റെ മേഖലയിലെ സേവന മേഖലയിലെ സേവന സ്ഥാപനമാണ്. വിൻഡോസിലും മാക്കിനായുള്ള ABBYY ഫൈൻ റീഡർ പിഡിഎഫിലേക്ക് ടെക്സ്റ്റായി മാറ്റുന്നതിനുള്ള ശക്തമായ ഒരു പരിഹാരമാണ്.

പ്രോഗ്രാമിന്റെ വെബ് കോണ്ടാക്റ്റ് തീർച്ചയായും പ്രവർത്തനക്ഷമതയിൽ താഴ്ന്നതാണ്. എന്നിരുന്നാലും, 190-ലധികം ഭാഷകളിലുള്ള സ്കാനുകളിലും ഫോട്ടോകളിലും നിന്നുള്ള ടെക്സ്റ്റ് ഈ സേവനത്തിന് തിരിച്ചറിയാനാകും. പിഡിഎഫ് ഫയലുകളെ വേഡ്, എക്സൽ തുടങ്ങിയവയിലേക്ക് മാറ്റാൻ സാധിക്കുന്നു.

ABBYY ഫൈൻ റീഡർ ഓൺലൈൻ ഓൺലൈൻ സർവീസ്

ഉപകരണം ഉപയോഗിച്ച് പ്രവർത്തിക്കാൻ തുടങ്ങുന്നതിന് മുമ്പ്, സൈറ്റിൽ ഒരു അക്കൗണ്ട് സൃഷ്ടിക്കുക അല്ലെങ്കിൽ നിങ്ങളുടെ Facebook, Google അല്ലെങ്കിൽ Microsoft അക്കൗണ്ട് ഉപയോഗിച്ച് ലോഗിൻ ചെയ്യുക.

ലോഗിൻ വിൻഡോയിലേക്ക് പോകാൻ, ബട്ടണിൽ ക്ലിക്കുചെയ്യുക. "പ്രവേശിക്കൂ" മുകളിലെ മെനു ബാറിൽ.
ഒരിക്കൽ ലോഗിൻ ചെയ്ത ശേഷം, ആവശ്യമുള്ള PDF പ്രമാണം FineReader- ലേക്ക് ബട്ടൺ ഉപയോഗിച്ച് ഇറക്കുമതി ചെയ്യുക "ഫയലുകൾ അപ്ലോഡ് ചെയ്യുക".

തുടർന്ന് ക്ലിക്കുചെയ്യുക "പേജ് നമ്പറുകൾ തിരഞ്ഞെടുക്കുക" ടെക്സ്റ്റ് തിരിച്ചറിയലിനായി ആവശ്യമുള്ള സ്പാനിനെ വ്യക്തമാക്കുക.
അടുത്തതായി, പ്രമാണത്തിൽ കാണിച്ചിരിക്കുന്ന ഭാഷകൾ, ഫലമായുണ്ടാകുന്ന ഫയൽ ഫോർമാറ്റ്, ബട്ടൺ ക്ലിക്ക് ചെയ്യുക "അംഗീകരിക്കുക".
പ്രോസസ് ചെയ്തതിനുശേഷം, ദൈർഘ്യത്തിന്റെ ദൈർഘ്യത്തെ പൂർണ്ണമായും ആശ്രയിച്ചിരിക്കുന്ന ദൈർഘ്യത്തെ ആശ്രയിച്ച്, പൂർത്തിയാക്കിയ ഫയൽ നിങ്ങൾക്ക് അതിന്റെ പേരിൽ ക്ലിക്കുചെയ്തുകൊണ്ട് ടെക്സ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് ഡൌൺലോഡ് ചെയ്യാം.

അല്ലെങ്കിൽ ലഭ്യമായ ക്ലൗഡ് സേവനങ്ങളിലൊന്നിലേക്ക് ഇത് എക്സ്പോർട്ടുചെയ്യുക.

ചിത്രത്തിലും PDF ഫയലുകളിലും ഏറ്റവും കൃത്യമായ ടെക്സ്റ്റ് റെക്കഗ്നിഷൻ അൽഗോരിതങ്ങൾ ഈ സേവനം വേർതിരിച്ചെടുത്തിട്ടുണ്ട്. പക്ഷേ, നിർഭാഗ്യവശാൽ, മാസത്തിൽ പ്രോസസ്സ് ചെയ്യപ്പെട്ട അഞ്ച് പേജുകളിലേക്ക് അതിന്റെ സൗജന്യ ഉപയോഗം പരിമിതമാണ്. കൂടുതൽ അളവിലുള്ള പ്രമാണങ്ങൾക്കൊപ്പം, നിങ്ങൾ ഒരു വർഷത്തെ സബ്സ്ക്രിപ്ഷൻ വാങ്ങണം.

എന്നിരുന്നാലും, OCR ഫംഗ്ഷൻ വളരെ അപൂർവ്വമായി ആവശ്യമാണ് എങ്കിൽ, ABBYY FineReader ഓൺലൈൻ ചെറിയ PDF ഫയലുകളിൽ നിന്നും വാചകം വേർതിരിക്കുന്നതിനുള്ള ഒരു മികച്ച ഓപ്ഷനാണ്.

രീതി 2: സൌജന്യ ഓൺലൈൻ OCR

ടെക്സ്റ്റ് ഡിജിറ്റൈസ് ചെയ്യുന്നതിന് ലളിതവും സൗകര്യപ്രദവുമായ സേവനം. രജിസ്ട്രേഷന്റെ ആവശ്യമില്ലെങ്കിൽ, മണിക്കൂറിൽ 15 പൂർണ്ണ PDF പേജുകൾ തിരിച്ചറിയാൻ റിസോഴ്സ് നിങ്ങളെ അനുവദിക്കുന്നു. 46 ഓൺലൈൻ ഭാഷകളിൽ സൌജന്യ ഓൺലൈൻ ഓസിആർ പൂർണ്ണമായി പ്രവർത്തിക്കുന്നു, കൂടാതെ പ്രമാണങ്ങൾ ഇല്ലാതെ DOCX, XLSX, TXT എന്നീ മൂന്ന് ടെക്സ്റ്റ് ഫോർമാറ്റുകൾ പിന്തുണയ്ക്കുന്നു.

രജിസ്ടർ ചെയ്യുമ്പോൾ, ഉപയോക്താവിനു മൾട്ടി-പേജ് രേഖകൾ പ്രൊസസ്സ് ചെയ്യാൻ കഴിയും, എന്നാൽ ഈ പേജുകളുടെ സൗജന്യ എണ്ണം 50 യൂണിറ്റുകളായി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു.

സൌജന്യ ഓൺലൈൻ OCR ഓൺലൈൻ സേവനമാണ്

PDF ൽ നിന്നും ഒരു "ഗസ്റ്റ്" എന്ന പാഠം ഉറവിടത്തിൽ അംഗീകരിക്കാതെ അംഗീകരിക്കാൻ, സൈറ്റിന്റെ പ്രധാന പേജിൽ ഉചിതമായ ഫോം ഉപയോഗിക്കുക.

ബട്ടൺ ഉപയോഗിച്ച് ആവശ്യമുള്ള പ്രമാണം തിരഞ്ഞെടുക്കുക "ഫയൽ", പ്രധാന ടെക്സ്റ്റ് ഭാഷ, ഔട്ട്പുട്ട് ഫോർമാറ്റ് വ്യക്തമാക്കുക, തുടർന്ന് ഫയൽ ലോഡുചെയ്യുന്നതിനായി കാത്തിരിക്കുക ക്ലിക്കുചെയ്യുക "പരിവർത്തനം ചെയ്യുക".
ഡിജിറ്റൽ പ്രക്രിയയുടെ അവസാനം, ക്ലിക്ക് ചെയ്യുക "ഔട്ട്പുട്ട് ഫയൽ ഡൌൺലോഡ് ചെയ്യുക" പൂർത്തിയായി പ്രമാണത്തിൽ കമ്പ്യൂട്ടറിൽ വാചകം സൂക്ഷിക്കുക.

അംഗീകൃത ഉപയോക്താക്കൾക്ക്, പ്രവർത്തനങ്ങളുടെ ക്രമം കുറച്ച് വ്യത്യസ്തമാണ്.

ബട്ടൺ ഉപയോഗിക്കുക "രജിസ്ട്രേഷൻ" അല്ലെങ്കിൽ "പ്രവേശിക്കൂ" മുകളിൽ മെനു ബാറിലെ, ഒരു അക്കൗണ്ട് സൌജന്യ ഓൺലൈൻ OCR സൃഷ്ടിക്കുക അല്ലെങ്കിൽ അതിൽ പോയി.
അംഗീകാര പാനലിൽ അംഗീകാരത്തിനു ശേഷം കീ അമർത്തിപ്പിടിക്കുക "CTRL"ലഭ്യമാക്കിയ ലിസ്റ്റിൽ നിന്നും ഉറവിട രേഖയുടെ രണ്ടു ഭാഷകളിലേക്കു് തെരഞ്ഞെടുക്കുക.
PDF ൽ നിന്നും വാചകം വേർതിരിച്ചുള്ള ബട്ടൺ ക്ലിക്കുചെയ്ത് കൂടുതൽ ഓപ്ഷനുകൾ വ്യക്തമാക്കുക. "ഫയൽ തിരഞ്ഞെടുക്കുക" സേവനം ഡോക്യുമെന്റിൽ ചേർക്കുന്നതിന്.

തിരിച്ചറിയൽ ആരംഭിക്കുന്നതിന്, ക്ലിക്കുചെയ്യുക "പരിവർത്തനം ചെയ്യുക".
ഡോക്യുമെന്റ് പ്രാക്റ്റീസ് ചെയ്തതിനുശേഷം, അനുബന്ധ നിരയിലെ ഔട്ട്പുട്ട് ഫയലിന്റെ പേരുപയോഗിച്ച് ലിങ്ക് ക്ലിക്ക് ചെയ്യുക.

തിരിച്ചറിയൽ ഫലം ഉടൻ നിങ്ങളുടെ കമ്പ്യൂട്ടറിന്റെ മെമ്മറിയിൽ സംഭരിക്കപ്പെടും.

ഒരു ചെറിയ പിഡിഎഫ് പ്രമാണത്തിൽ നിന്നും ടെക്സ്റ്റ് എക്സ്ട്രാക്റ്റ് ചെയ്യണമെങ്കിൽ മുകളിൽ പറഞ്ഞിരിക്കുന്ന ടൂൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് സുരക്ഷിതമായി ആശ്രയിക്കാം. വലിയ ഫയലുകൾ പ്രവർത്തിക്കാൻ, നിങ്ങൾ സ്വതന്ത്ര ഓൺലൈൻ OCR ൽ അധിക ചിഹ്നങ്ങൾ വാങ്ങുകയോ മറ്റൊരു പരിഹാരത്തിലേക്ക് തിരക്കുകയോ ചെയ്യണം.

രീതി 3: NewOCR

DjVu, PDF തുടങ്ങിയ എല്ലാ ഗ്രാഫിക്, ഇലക്ട്രോണിക് പ്രമാണങ്ങളിൽ നിന്നും പാഠം വേർതിരിച്ചെടുക്കാൻ നിങ്ങളെ അനുവദിക്കുന്ന പൂർണ്ണമായും സൌജന്യ OCR- സേവനം. തിരിച്ചറിഞ്ഞിട്ടുള്ള ഫയലുകളുടേയും വലുപ്പത്തിനായും റിസോഴ്സ് നിയന്ത്രണങ്ങളൊന്നും വരുത്തുന്നില്ല, രജിസ്ട്രേഷൻ ആവശ്യമില്ല, അതിനോടനുബന്ധിച്ചുള്ള വിവിധ ഫംഗ്ഷനുകൾ നൽകുന്നു.

NewOCR 106 ഭാഷകളെ പിന്തുണയ്ക്കുന്നു, കൂടാതെ താഴ്ന്ന നിലവാരമുള്ള ഡോക്യുമെൻറുകളുടെ സ്കാൻ ശരിയായി കൈകാര്യം ചെയ്യാനും കഴിയും. ഫയൽ പേജിൽ വാചക തിരിച്ചറിയലിനായി ഏരിയ സ്വമേധയാ തെരഞ്ഞെടുക്കാൻ കഴിയും.

ഓൺലൈൻ സേവനം NEWOCR

അതുകൊണ്ട്, അനാവശ്യ നടപടികൾ ആവശ്യമില്ലാതെ തന്നെ നിങ്ങൾക്ക് റിസോഴ്സ് പ്രവർത്തിപ്പിക്കാൻ കഴിയും.

പ്രധാന പേജ് നേരിട്ട് സൈറ്റിലേക്ക് പ്രമാണം ഇറക്കുമതി ചെയ്യുന്നതിനുള്ള ഒരു ഫോം ഉണ്ട്. NewOCR- യിലേക്ക് ഒരു ഫയൽ അപ്ലോഡുചെയ്യുന്നതിന്, ബട്ടൺ ഉപയോഗിക്കുക "ഫയൽ തിരഞ്ഞെടുക്കുക" വിഭാഗത്തിൽ "നിങ്ങളുടെ ഫയൽ തിരഞ്ഞെടുക്കുക". അപ്പോൾ വയലിൽ "തിരിച്ചറിയൽ ഭാഷ (കൾ)" ഉറവിട പ്രമാണത്തിന്റെ ഒന്നോ അതിലധികമോ ഭാഷകൾ തിരഞ്ഞെടുക്കുക, തുടർന്ന് ക്ലിക്കുചെയ്യുക "അപ്ലോഡ് + OCR".
നിങ്ങളുടെ മുൻഗണന തിരിച്ചറിയൽ ക്രമീകരണങ്ങൾ സജ്ജമാക്കുക, വാചകം വേർതിരിക്കാൻ ആവശ്യമുള്ള പേജ് തിരഞ്ഞെടുക്കുക, തുടർന്ന് ബട്ടൺ ക്ലിക്കുചെയ്യുക. "OCR".
ഒരു ബിറ്റ് സ്ക്രോൾ ചെയ്ത് ബട്ടൺ കണ്ടെത്തുക. ഡൗൺലോഡ് ചെയ്യുക.

അതിൽ ക്ലിക്കുചെയ്ത് ഡ്രോപ്പ് ഡൌൺ ലിസ്റ്റിൽ ഡൌൺലോഡ് ചെയ്യാനായി ആവശ്യമായ രേഖ ഫോർമാറ്റ് തിരഞ്ഞെടുക്കുക. അതിനു ശേഷം, വേർതിരിച്ചെടുത്ത വാചകത്തോടെയുള്ള ഫയൽ നിങ്ങളുടെ കമ്പ്യൂട്ടറിലേക്ക് ഡൌൺലോഡ് ചെയ്യപ്പെടും.

ഈ ഉപകരണം സൗകര്യപ്രദമാണ്, കൂടാതെ എല്ലാ പ്രതീകങ്ങളും ഉയർന്ന നിലവാരത്തിൽ തിരിച്ചറിയുന്നു. എന്നിരുന്നാലും, ഇമ്പോർട്ട്ഡ് പിഡിഎഫ് ഡോക്യുമെന്റിന്റെ ഓരോ പേജിന്റെയും പ്രോസസ്സ് സ്വതന്ത്രമായി ആരംഭിച്ച് ഒരു പ്രത്യേക ഫയലിൽ പ്രദർശിപ്പിക്കേണ്ടതുണ്ട്. നിങ്ങൾക്ക് തീർച്ചയായും, തിരിച്ചറിയൽ ഫലങ്ങൾ ഉടൻ ക്ലിപ്ബോർഡിലേക്ക് പകർത്തി മറ്റുള്ളവരുമായി ലയിപ്പിക്കാൻ കഴിയും.

എന്നിരുന്നാലും, മുകളിൽ പറഞ്ഞ വൈകല്യം നൽകി, പുതിയ ലോക്കറിലൂടെയുള്ള വലിയ അളവിലുള്ള പാഠം വേർതിരിച്ചെടുക്കാൻ വളരെ പ്രയാസമാണ്. ഒരേ ചെറിയ ഫയലുകളുടെ സേവനം "ഒരു മഹാസുരവുമായി" പകർത്തുന്നു.

രീതി 4: OCR.Space

ടെക്സ്റ്റ് ഡിജിറ്റൈസ് ചെയ്യുന്നതിനുള്ള ലളിതവും മനസ്സിലാക്കാവുന്നതുമായ ഒരു ഉറവിടം നിങ്ങളെ PDF രേഖകളെ തിരിച്ചറിയുന്നതിനും ഫലം ഒരു TXT ഫയലിൽ ഔട്ട്പുട്ട് ചെയ്യുന്നതിനും അനുവദിക്കുന്നു. പേജുകളുടെ എണ്ണത്തിൽ പരിധി ഇല്ല. ഇൻപുട്ട് പ്രമാണത്തിന്റെ വലുപ്പം 5 മെഗാബൈറ്റിലധികം കവിയാൻ പാടില്ല എന്നതാണ് ഏക പരിധി.

OCR.Space ഓൺലൈൻ സേവനം

ഉപകരണം ഉപയോഗിച്ച് രജിസ്റ്റർ ചെയ്യേണ്ട ആവശ്യമില്ല.

ബട്ടൺ ഉപയോഗിച്ച് നിങ്ങളുടെ കമ്പ്യൂട്ടറിൽ നിന്ന് മുകളിലുള്ള ലിങ്ക് ക്ലിക്കുചെയ്ത് നിങ്ങളുടെ PDF പ്രമാണം വെബ് സൈറ്റിൽ അപ്ലോഡ് ചെയ്യുക "ഫയൽ തിരഞ്ഞെടുക്കുക" അല്ലെങ്കിൽ നെറ്റ്വർക്ക് - റഫറൻസ് വഴി.
ഡ്രോപ്പ്ഡൌൺ ലിസ്റ്റിൽ "OCR ഭാഷ തിരഞ്ഞെടുക്കുക" ഇറക്കുമതി ചെയ്ത പ്രമാണത്തിന്റെ ഭാഷ തിരഞ്ഞെടുക്കുക.

തുടർന്ന് ബട്ടണിൽ ക്ലിക്കുചെയ്യുന്നതിലൂടെ വാചക തിരിച്ചറിയൽ പ്രക്രിയ ആരംഭിക്കുക. "OCR ആരംഭിക്കുക!".
ഫയൽ പ്രോസസ്സിംഗിന്റെ അവസാനം, ഫലം കാണുക "OCR" ഫലം കൂടാതെ ക്ലിക്കുചെയ്യുക ഡൗൺലോഡ് ചെയ്യുകപൂർത്തിയായ TXT പ്രമാണം ഡൌൺലോഡ് ചെയ്യാൻ.

നിങ്ങൾ PDF ൽ നിന്നും പാഠം എക്സ്ട്രാക്റ്റ് ചെയ്യണമെങ്കിൽ ഫൈനൽ ഫോർമാറ്റിംഗും പ്രധാനമല്ലങ്കിൽ OCR.Space ഒരു നല്ല ചോയ്സ് ആണ്. സേവനത്തിൽ ഒരേ സമയം രണ്ടോ അതിൽ കൂടുതലോ ഭാഷകൾക്കുള്ള അംഗീകൃതമല്ലാത്തതിനാൽ, ഒരേയൊരു പ്രമാണം "ഒറ്റപ്പെടുത്തൽ" ആയിരിക്കണം.

ഇതും കാണുക: സ്വതന്ത്ര അനലോഗ് ഫൈൻ റീഡർ

ലേഖനത്തിൽ അവതരിപ്പിച്ച ഓൺലൈൻ ഉപകരണങ്ങൾ വിലയിരുത്തുക, അബിബൈയിയിൽ നിന്നുള്ള FineReader ഓൺലൈൻ OCR ഫംഗ്ഷൻ വളരെ കൃത്യമായും കൃത്യമായും കൈകാര്യം ചെയ്യുന്നു എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. ടെക്സ്റ്റ് തിരിച്ചറിയലിൻറെ പരമാവധി കൃത്യത നിങ്ങൾക്ക് പ്രധാനമാണെങ്കിൽ, ഈ ഓപ്ഷൻ പ്രത്യേകം പരിഗണിക്കുന്നതാണ് നല്ലത്. അതിനുവേണ്ടി പണമടയ്ക്കാൻ, ഏറ്റവും സാധ്യതയും വേണം.

ചെറിയ ഡോക്യുമെന്റുകൾ ഡിജിറ്റൈസ് ചെയ്യണമെങ്കിൽ നിങ്ങൾ സേവനത്തിൽ പിശകുകൾ തിരുത്താൻ തയ്യാറാണെങ്കിൽ, NEWOCR, OCR.Space അല്ലെങ്കിൽ സൌജന്യ ഓൺലൈൻ OCR ഉപയോഗിക്കുന്നതാണ് അഭികാമ്യം.