Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.
В настоящее время, школьные и правительственные документы выкладываются во Всемирную паутину в основном именно в PDF-формате. До настоящего времени Google не мог распознать текст и воспринимал содержимое как картинку.
И вот, у Интернет гиганта появилась новейшая технология оптического распознавания символов (Optical Character Recognition). Векторная информация изображения преобразовывается поисковым алгоритмом в слова, которые в свою очередь легко поддаются индексированию.
«Теперь результаты поиска будут значительно шире и точнее», радуются в Google. Что касается пользователя, то у него появится возможность находить гораздо больше нужной информации.
По материалам сайта http://eterra.info/news/260
Благодарю Вас!
А еще Вы можете подписаться на рассылку и первым получать самые свежие статьи.
Автор: Сергей Ваулин
Похожие записи по этой теме:
- О книге SEO Монстр 2020
- Новый алгоритм Google BERT – полный обзор. (И что теперь делать вебмастеру)
- Увеличение заработка на Google Adsense с помощью VipIp.ru (окончание). Составление задания в Конструкторе
- Как с помощью VipIP заработать на рекламе
- Как ускорить индексацию страницы в Google
- Google и мобильный поиск
- Большие изменения в Рекомендациях Google
- Как правильно удалять ссылки в Google?
- Какую социальную сеть выбрать – для общения и для работы? Краткий анализ аудитории социальных сетей
- Google против Sape. Грядет вторая серия?