480.74
+0.03
511.65
+0.46
7.48
-0.03
+1
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
12:12
03 Декабря 2016
Ученые нашли в Антарктиде жука возрастом 14 миллионов лет
На территории современной Антарктиды обитает лишь три вида насекомых, но в прошлом их было значительно больше
15:17
02 Декабря 2016
Стивен Хокинг указал на наступление "самого опасного времени на нашей планете"
Указанные проблемы, по Хокингу, можно решить только совместными усилиями всех стран и слоев общества
11:37
02 Декабря 2016
Facebook воспользуется искусственным интеллектом для выявления фейков
Социальная сеть Facebook будет использовать искусственный интеллект (artificial intelligence, AI) для выявления фейковых новостей и сцен насилия в прямых видеотрансляциях
00:49
01 Декабря 2016
СМИ сообщили о возможной блокировке в России соцсети Facebook
В исковом заявлении мужчина, являющийся зарегистрированным пользователям соцсети, указал на нарушения российского законодательства
19:22
30 Ноября 2016
"Яндекс" запустил уникальную панорамную карту Еревана
"Яндекс" запустил первую в мире панорамную карту Еревана, сообщил генеральный директор "Яндекс.Такси" Тигран Худавердян.
09:26
30 Ноября 2016
В НАСА назвали одно из наиболее подходящих для колонизации человеком небесное тело
Атмосферное давление у поверхности этого небесного тела в 1,5 раза больше, чем на Земле, что позволяет упростить устройство скафандра для потенциальных колонизаторов
21:54
29 Ноября 2016
Искусственный интеллект научился предсказывать будущее
На данный момент искусственному интеллекту предстоит еще многому научиться
19:48
29 Ноября 2016
Планетологи обнаружили загадочный лабиринт на Марсе (ФОТО)
Планетологи представили снимок загадочной сети лабиринтов, расположенных на равнине Утопия в северных низменностях Марса
15:44
28 Ноября 2016
Караундж – "армянский Стоунхендж", вошел в список древнейших обсерваторий мира по версии National Geographic
Научно-популярный географический журнал National Geographic включил мегалитический комплекс Караундж, который называют "армянским Стоунхенджем", в список древнейших обсерваторий мира
15:29
28 Ноября 2016
В Земле на глубине 1000 километров обнаружен океан
Международный коллектив геофизиков впервые обнаружил прямое доказательство наличия водосодержащих жидкостей в верхнем слое нижней мантии на рекордной глубине — около тысячи километров от поверхности Земли.
09:38
27 Ноября 2016
Создана интерактивная карта развития эмбриона (ВИДЕО)
Группа Нидерландских ученых создала трехмерную интерактивную модель эмбриона человека, которая позволяет в подробностях изучить процесс развития плода. Исследование опубликовано в научном журнале Science.
17:34
26 Ноября 2016
Предложен способ обнаружения внеземных цивилизаций
Ученые из Белградской астрономической обсерватории (Сербия) рассказали о деятельности инопланетных цивилизаций, проявления которой человечество могло бы обнаружить уже сегодня.