Гугл переводчик с распознаванием текста

Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.

Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.

Для примера распознавала фотографию документа, который есть у каждого — свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).

Сервис Нужна регистрация Рейтинг Адрес
Google да 3 https://drive.google.com/drive
Abbyy Finereader да 5 https://finereaderonline.com/ru-ru
Online OCR2 - 5 http://www.onlineocr.net
Free Online OCR - 2 https://www.newocr.com
OCR Convert - 4 http://www.ocrconvert.com
Free OCR - 1 www.free-ocr.com
I2OCR - 4 http://www.i2ocr.com
Яндекс ОCR Распознает и переводит. 5 https://translate.yandex.ru/ocr
Convertio Работает своеобразно 3 https://convertio.co/ru/ocr/

Google

В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.

Входные форматы PDF , JPEG, PNG, GIF
Выходные форматы Word, Open Document, RTF, Adobe PDF, HTML, Text Plain, Epub (но форматирование исчезает — нарушается компоновка картинок с текстом)
Размер файла До 2 Мб
Ограничения Ограничено только размером хранилищ Google.

Качество исходника рекоменовано не меньше 10 пикселей по высоте для строки.

Качество Так себе — качество распознавания свидетельства инн хуже, чем с Finereader. И ФИО, и номер инн полностью потеряны.

Как пользоваться

  1. Загрузите файл на страницу drive.google.com или выберите там уже загруженную картинку
  2. Нажмите правой кнопкой мыши на нужный файл.
  3. Выберите «Открыть с помощью» -> «Google Документы».
  4. Картинка преобразуется в документ Google и откроется на вкладке https://docs.google.com

Abbyy Finereader

В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия — можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р). Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.

Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG
Выходные форматы Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub
Размер файла До 100Мб
Ограничения 10 картинок на две недели
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Online OCR — какие-то части документа лучше распознались тем сервисом, а какие-то — этим.

Результат распознавания Finereader. (ФИО и город распознаны, но стерты вручную)

Как пользоваться

  1. Загрузите файлы
  2. Выберите язык
  3. Выберите выходной формат
  4. Щелкните кнопку «Распознать»

Распознавание текста онлайн без регистрации

Online OCR

Online OCR http://www.onlineocr.net/ — единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:

Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)

Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG, GIF
Выходные форматы Word, Excel, Adobe PDF, Text Plain
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Распознает не более 15 картинок в час без регистрации
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader — какие-то части документа лучше распознались тем сервисом, а какие-то — этим.

Как пользоваться

  1. Загрузите файл (щелкните «Select File»)
  2. Выберите язык и выходной формат
  3. Введите капчу и щелкните «Convert»

Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым

Читайте также:  Использование ati команд для определения ip

Free Online OCR

Free Online OCR https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).

Входные форматы PDF, DjVu JPEG, PNG, GIF, BMP, TIFF
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Ограничения на количество нет
Качество Качество распознавания свидетельства инн плохое.

Можно распознавать как все целиком, так и выделить часть изображения для распознавания.

Как пользоваться

  1. Выберите файл или вставьте url файла и щелкните «Preview» — картинка загрузится и появится в окне браузера Не забудьте правильно указать язык.
  2. Выберите область сканирования (можно оставить целиком как есть)
  3. Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»
  4. Внизу появится окно с текстом

OCR Convert

OCR Convert http://www.ocrconvert.com/ txt

Входные форматы Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 5Мб общий размер файлов за один раз.
Ограничения Одновременно до 5 файлов. Сколько угодно раз.
Качество Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader

Как пользоваться

    1. Загрузите файл, выберите язык и щелкните кнопку «Process»

    Free OCR

    Free OCR www.free-ocr.com распознал документ хуже всех.

    Входные форматы PDF, JPG, PNG, BMP, GIF, TIFF
    Выходные форматы Text Plain
    Размер файла До 6Мб
    Ограничения У PDF-файла распознается только первая страница
    Качество Качество распознавания свидетельства инн низкое — правильно распознано только три слова.

    Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Щелкните кнопку «Start»

      I2OCR

      I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.

      Входные форматы JPG, PNG, BMP, TIF, PBM, PGM, PPM
      Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
      Размер файла До 10Мб
      Ограничения нет
      Качество Качество распознавания свидетельства инн среднее — сравнимо с OCR Convert.

      Замечено, что сервис временами не работает.

      Как пользоваться

      1. Выберите язык
      2. Загрузите файл
      3. Введите капчу
      4. Щелкните кнопку «Extract text»
      5. По кнопке «Download» можно загрузить выходной файл в нужном формате

        Яндекс OCR

        Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.

        Просто перейдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и щелкните «Открыть в Переводчике». Откроется как текст с картинки, так и перевод в правом поле.

        Перетащите картинку Результат распознавания

        Convertio

        Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, поэтому сравнивать его тяжело. В целом не понравился. Свидетельство ИНН, загруженное целиком, он не распознал совсем, так как плохо выделяет текст среди картинок. Не распозналось ни одного слова! Для его проверки я вырезала текстовый кусочек из ИНН и распознала его — это удалось сделать.

        К тому же временами он зависает в попытках что-либо распознать.

        Входные форматы pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp, webp
        Выходные форматы Text Plain, PDF, Word , Excel, Pptx, Djvu, Epub, Fb2, Csv
        Размер файла ?, зависит от тарифа
        Ограничения 10 страниц бесплатно, дальше тарифы от 7 долларов.
        Качество Сложно оценить — файл с картинками (ИНН) не распознал совсем, отдельно вырезанный кусок текста распознал.

        Замечено, что при распознавании сервис временами зависает, возможно ваши картинки ставятся в большую очередь на бесплатном тарифе.

        Как пользоваться

        1. Загрузите файл
        2. Выберите язык
        3. Выберите выходной формат
        4. Введите капчу
        5. Щелкните «Преобразовать»
        6. Чтобы увидеть результат, промотайте наверх к форме загрузки файлов. Там же можно будет и скачать результат.

        Интерфейс Convertio

        Вырезанный и распознанный кусок (целиком не распознается):

        Результат работы Convertio

        Читайте также:  Как вернуть матрицу из функции c

        Заключение

        Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.

        Хуже всего сработал Free OCR — он распознал всего три слова.

        Распознавание текста онлайн — ТОП-9 сервисов: 3 комментария

        СПАСИБО! И меня очень выручили… по поиску в яндексе мои попытки тоже были безуспешные, а статья помогла и выбрала отличный ресурс, который преобразовал все 30 страниц) к слову, нужно было очень быстро и срочно!)))

        если есть такая возможность то напишите пожалуйста
        есть страничка
        на ней картинки с текстом
        конкретно адреса электронной почты
        https://www.math.fsu.edu/People/faculty.php
        вопрос можно ли вытащить каким то средствами текст этих адресов

        согласен что это не хорошо но увы нужно

        сделайте скриншот, да распознайте картинку. Правда, качество там не очень

        Перевод PDF-документов, собственный словарь, работа в режиме офлайн — это лишь малая часть возможностей сервиса.

        Рукописный ввод

        «Google Переводчик» поддерживает не только простой набор слов при помощи клавиатуры, но и рукописный ввод. Причём это касается как веб-версии сервиса, так и мобильного приложения. В первом случае достаточно лишь нажать на иконку карандаша в нижней части окна ввода. Сенсорный экран или поддержка стилуса не понадобится.

        Писать в открывшемся окне можно при помощи мыши, зажав её левую кнопку. Ниже области ввода будут появляться слова, которые сервис смог распознать.

        В мобильном приложении рукописный ввод реализован куда удобнее. Активируется он нажатием на иконку ручки, после чего пальцем вы сможете вырисовывать как отдельные буквы, так и целые слова. Такой метод ввода может быть особенно полезен для изучающих иероглифические языки: японский, китайский или корейский.

        Перевод в режиме офлайн

        Мобильный «Google Переводчик» уже давно может работать без подключения к Сети. Нужно лишь предварительно загрузить словари нужных вам языков. Сделать это можно из бокового меню приложения, выбрав «Перевод офлайн».

        В этом разделе языковые пакеты можно не только сохранять, но и удалять из памяти смартфона.

        Синхронный перевод

        В мобильном «Google Переводчике» есть озвучка набранного текста и даже голосовой ввод, однако куда более полезной функцией является «Общение». Она позволяет перейти в специальный режим с синхронным переводом для диалога с иностранцем.

        В этом режиме приложение слушает и переводит на язык собеседника все фразы, проговаривая их голосом и отображая текстом. Чтобы предложить кому-то поболтать через функцию «Общение», нужно выбрать язык и нажать на иконку ладони в правом верхнем углу. После этого на экране отобразится специальное приветственное сообщение на выбранном вами языке.

        Также отметим, что для режима синхронного перевода и голосового ввода в целом можно активировать функцию цензуры. Она будет скрывать за звёздочками (***) всю ненормативную лексику, которую распознает. Найти эту функцию можно в настройках приложения, в разделе «Голосовой ввод».

        Мгновенный перевод через камеру

        Не менее полезная функция мобильного приложения — перевод текста при помощи камеры смартфона. В режиме реального времени готовый текст будет отображаться вместо той надписи, которую вы снимаете. Мгновенный перевод пригодится в том случае, когда нужно узнать, что означает какая-то вывеска или предостерегающий знак. Особенно это будет удобно за рубежом

        Для перехода к этой функции нужно лишь запустить камеру с панели инструментов приложения. В самом режиме съёмки можно открыть и любое ранее полученное фото, где есть что перевести.

        Собственный словарь

        Переводы любых слов или фраз можно сохранить в собственном словаре, чтобы позже к ним можно было вернуться. Для этого нужно лишь нажать на звёздочку. В мобильном «Переводчике» она отображается прямо напротив перевода, а в веб-версии сервиса — под ним.

        Перейти к списку сохранённых переводов на смартфоне можно будет через главное меню, нажав на «Разговорник». На десктопе путь к этому разделу лежит через кнопку звёздочки над областью перевода.

        Перевод из любого приложения

        На Android-смартфонах «Google Переводчик» предлагает удобную функцию быстрого перевода из любых приложений, где можно выделить текст. Отметив нужное слово или фразу, нужно развернуть контекстное меню, нажав на три точки, и выбрать «Перевод».

        Читайте также:  Беспроводные наушники ксиаоми спорт

        Поверх исходного приложения откроется мини-окно переводчика, где при необходимости можно будет сменить язык или прослушать произношение. Включается эта функция в настройках приложения, в разделе с логичным названием «Быстрый перевод».

        Перевод СМС

        Чтобы перевести текст пришедшей СМС, совсем необязательно пользоваться копированием-вставкой. Перейти к сообщениям можно прямо из мобильного «Google Переводчика». Просто нажмите на «Перевод SMS» в главном меню и выберите сообщение.

        Перевод в строке поиска

        Если требуется узнать перевод одного или нескольких слов, то можно и вовсе обойтись простым запросом в поисковой строке. В случае с переводом на английский язык он должен иметь вид: ваше слово или фраза + «на английском». Пример на скриншоте ниже.

        Функция перевода через поисковую строку актуальна как для смартфонов, так и для ПК.

        Перевод сайтов

        Перевести текст с зарубежного сайта на ПК можно тремя различными способами. Самый очевидный — банальное копирование и вставка в переводчик. В случае с небольшими фрагментами текста это может быть удобно, но если нужно перевести всю страницу, лучше воспользоваться иными методами.

        К примеру, можно просто скопировать ссылку на страницу сайта и вставить её в «Google Переводчик». В окне справа появится ссылка на этот же сайт, но уже на нужном языке и с сохранением всей разметки.

        Другой способ предполагает наличие браузера Chrome. В нём при посещении зарубежного ресурса в адресной строке справа появится иконка «Google Переводчика». Нажатие на неё также позволит перевести весь сайт целиком.

        Перевод документов

        Это ещё одна функция, актуальная только для веб-версии сервиса. Она позволяет загрузить из памяти компьютера текстовый документ и посмотреть его перевод. Это может быть файл формат PDF или, к примеру, DOCX.

        Для загрузки документа нужно полностью очистить область ввода текста и нажать под ним на ссылку «Переведите документ». После выбора файла останется лишь нажать на кнопку перевода. Текст откроется в этом же окне. Качество такого перевода иногда оставляет желать лучшего, но с простыми документами функция может быть полезна.

        который поможет получить напечатанный текст из PDF документов и фотографий

        Принцип работы ресурса

        Отсканируйте или сфотографируйте текст для распознавания

        Загрузите файл

        Выберите язык содержимого текста в файле

        После обработки файла, получите результат * длительность обработки файла может составлять до 60 секунд

        • Форматы файлов
        • Изображения: jpg, jpeg, png
        • Мульти-страничные документы: pdf
        • Сохранение результатов
        • Чистый текст (txt)
        • Adobe Acrobat (pdf)
        • Microsoft Word (docx)
        • OpenOffice (odf)

        Наши преимущества

        • Легкий и удобный интерфейс
        • Мультиязычность
          Сайт переведен на 9 языков
        • Быстрое распознавание текста
        • Неограниченное количество запросов
        • Отсутствие регистрации
        • Защита данных. Данные между серверами передаются по SSL + автоматически будут удалены
        • Поддержка 35+ языков распознавания текста
        • Использование движка Tesseract OCR
        • Распознавание области изображения (в разработке)
        • Обработано более чем 5.1M+ запросов

        Основные возможности

        Распознавание отсканированных файлов и фотографий, которые содержат текст

        Форматирование бумажных и PDF-документов в редактируемые форматы

        Сегодня (3.08.2018) мы обновили наш сайт.
        Обновления коснулись интерфейса и добавления нового функционала:
        • загрузка файлов перетаскиванием;
        • в результатах возможность экспорта документа в Doc, Google Docs, pdf;
        • перевод текста;
        • проверка орфографии;
        Сайт стал лучше и удобнее для пользователей. Но ещё много функций и дополнений мы запланировали реализовать в будущем.

        0.5.2 (26.11.2018): Добавлен функционал для удаления запросов из истории

        Если Вы нашли какие-то баги, пожалуйста, сообщите нам, отправив письмо на email: web(собака)img2txt.com
        Спасибо.

        Поддерживаемые языки:
        Русский, Українська, English, Arabic, Azerbaijani, Azerbaijani — Cyrillic, Belarusian, Bengali, Tibetan, Bosnian, Bulgarian, Catalan; Valencian, Cebuano, Czech, Chinese — Simplified, Chinese — Traditional, Cherokee, Welsh, Danish, Deutsch, Greek, Esperanto, Estonian, Basque, Persian, Finnish, French, German Fraktur, Irish, Gujarati, Haitian; Haitian Creole, Hebrew, Croatian, Hungarian, Indonesian, Icelandic, Italiano, Javanese, Japanese, Georgian, Georgian — Old, Kazakh, Kirghiz; Kyrgyz, Korean, Latin, Latvian, Lithuanian, Dutch; Flemish, Norwegian, Polish Język polski, Portuguese, Romanian; Moldavian, Slovakian, Slovenian, Spanish; Castilian, Spanish; Castilian — Old, Serbian, Swedish, Syriac, Tajik, Thai, Turkish, Uzbek, Uzbek — Cyrillic, Vietnamese

        © 2014—2019 img2txt Сервис распознавания изображений / v.0.6.4.1