Яндекс добавил в облачный сервис распознавание текста на изображениях
Яндекс добавил в облачный сервис распознавание текста на изображенияхЯндекс теперь умеет распознавать

Об этом сообщается в блоге «Яндекса».

Для распознавания текста используется технология оптического распознавания символов, разработанная в стенах Яндекса.

Система состоит из двух частей — классификатора картинок и модуля распознавания. Точность распознавания зависит от типа изображения, четкости, контрастности фона относительно текста и прочих факторов. Сначала классификатор анализирует все изображения, отбирая те, на которых обнаруживается текст. Когда изображения с текстом отобраны, алгоритм находит на них линии, предположительно содержащие текст, а затем отбираются только те линии текста, в которых алгоритм уверен.

Разработчики «Яндекса» отказались от использования уже имеющихся в Глобальной сети методов и создали свой собственный, который может распознать текст даже на низкокачественных изображениях различного содержания. Для каждого символа определяется несколько наиболее вероятных вариантов распознавания.

Помимо русского языка система также распознает английский, украинский и турецкий. Например, это могут быть буквы «О», «о» и цифра «0», очень похожие друг на друга. Некоторые из них предназначены для частных случаев — например, Photoscore Ultimate распознаёт рукописные музыкальные партитуры. После этого в дело вступает языковая модель — алгоритм принимает решение, какой из символов-кандидатов подходит лучше всего.

Для разных видов изображений она разная. Поэтому для отсканированных документов она достигает показателя в 80%, для скриншотов приближается к 100%, а для фотографий с надписями составляет более скромные 63,2%. Точность распознавания текстов всего потока изображений превышает 70%.

Технология компьютерного зрения также присутствует в «Яндекс.Картинках», где она помогает искать схожие изображения.


Понравилась новость? Будем признательны, если поделитесь этой статьей в социальных сетях!



« Просмотров: 3 447 Комментариев:0
 

Категория: Прочee

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Комментарии:
Оставить комментарий



Полезные статьи
Интересное
Интересные статьи


Новости партнёров


Опрос

Где вы проведете Отпуск-2020



 


Календарь
«    Ноябрь 2024    »
ПнВтСрЧтПтСбВс
 123
45678910
11121314151617
18192021222324
252627282930 

Мы в соцсетях

Рейтинг@Mail.ru Яндекс.Метрика


**Свидетельство о регистрации СМИ: ИА №ФС 77-30623 от 14.12.2007
Выдано Федеральной службой по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия.
Гл.редактор: Боровов М.С. Телефон редакции: (8182) 433-885. E-mail: arh-info@yandex.ru