Допоможіть розробці сайту, ділитися статтею з друзями!

Вітаю всіх читачів блогу!

Я думаю, що тим хто часто працює за комп'ютером (не грає, а саме працює), доводилося стикатися з розпізнаванням тексту. Ну наприклад, відсканували ви уривок з книги і тепер вам необхідно цю частину вставити в свій документ. Але сканований документ являє собою картинку, а нам потрібен текст - для цього й потрібні спеціальні програми і онлайн сервіси для розпізнавання тексту з картинок.

Про програми для розпізнавання я вже писав в попередніх постах:

- сканування тексту і розпізнавання в FineReader (платна програма);

- робота в аналогу FineReader - CuneiForm (безкоштовна програма).

У цій же статті хотілося б зупинитися на онлайн сервісах для розпізнавання тексту. Адже, якщо потрібно по швидкому отримати текст з 1-2 картинок - немає сенсу морочитися з установкою різних програм …

Важливо! Якість розпізнавання (кількість помилок, читаність і ін.) Залежить дуже сильно від вихідної якості картинки. Тому, при скануванні (фотографуванні та ін.) Вибирайте якість якомога вище. У більшості випадків якості 300-400 dpi буде досить (dpi - параметр характеризує якість картинки. В налаштуваннях майже всіх сканерів, зазвичай, вказаний цей параметр).

онлайн сервіси

Для того, щоб показати роботу сервісів, я зробив скріншот одній зі своїх статей. Цей скріншот і буде завантажуватися на всі сервіси, опис яких представлено нижче.

1) http://www.ocrconvert.com/

Мені цей сервіс дуже подобатися своєю простотою. Сайт хоч і англійська, але добре працює і з російською мовою. Реєструватися не потрібно. Для початку розпізнавання потрібно зробити 3 дії:

- завантажити своє зображення;

- вибрати мову тексту, який на зображенні;

- натиснути кнопку початку розпізнавання.

Підтримка форматів: PDF, GIF, BMP, JPEG.

Результат представлений нижче на зображенні. Треба сказати, текст досить добре розпізнається. До того ж дуже швидко - я чекав буквально 5-10 сек.

2) http://www.i2ocr.com/

Цей сервіс працює аналогічно вищенаведеним. Тут так само потрібно завантажити файл, вибрати мову розпізнавання і натиснути кнопку витягти текст. Працює сервіс дуже швидко: 5-6 сек. на одну сторінку.

Підтримує формати: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Результат цей онлайн сервіс представляє набагато зручніше: ви відразу бачите два вікна - у першому результат розпізнавання, у другому - вихідне зображення. Тому досить легко внести правки по ходу редагування. Реєструватися на сервісі, до речі, теж не потрібно.

3) http://www.newocr.com/

Цей сервіс унікальний відразу за кількома параметрами. По-перше, він підтримує «новомодний» формат DJVU (до речі, повний список форматів: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). По-друге, підтримує виділення областей тексту на зображенні. Це дуже корисно, коли у вас на картинці є не тільки текстові області, а й графічні, які розпізнавати не потрібно.

Якість розпізнавання вище середнього, реєструватися не потрібно.

4) http://www.free-ocr.com/

Дуже простий сервіс для розпізнавання: завантажуєте зображення, вказуєте мову, вводите капчу (до речі, єдиний сервіс в цій статті, де це потрібно робити), і тиснете кнопку перевести картинку в текст. Власне все!

Підтримувані формати: PDF, JPG, GIF, TIFF, BMP.

Результат розпізнавання - середній. Є помилки, але їх не багато. Втім, якщо якість вихідного скриншота було б вище - помилок було б на порядок менше.

PS

На цьому сьогодні все. Якщо знаєте ще цікаві сервіси для розпізнавання тексту - поділіться в коментарях, буду вдячний. Одна умова: бажано щоб не потрібно було реєструватися і сервіс був безкоштовний.

Всього доброго!

Допоможіть розробці сайту, ділитися статтею з друзями!

Категорія: