484.68
+0.06
530.14
+2.1
8.5
-0.03
+9
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме

Другие материалы раздела
17:00
29 Апреля 2017
Ученые NASA обнаружили "ледяного близнеца" планеты Земля
Земля и планета, получившая название OGLE-2016-BLG-1195Lb, равноудалены от своих звезд, но звезда последней слишком слаба, поэтому наличие жизни на экзопланете маловероятно
20:28
27 Апреля 2017
Ученые обнародовали главную опасность употребления энергетиков
Ученые пришли к своим выводам в результате наблюдения за 18 добровольцами, которые разделили на две группы
12:12
27 Апреля 2017
Армянские планшеты и смартфоны заинтересовали Боливию
Первая официальная делегация из Боливии посетит Армению 21-28 мая, сообщает пресс-служба Министерства транспорта, связи и информационных технологий Армении.
09:16
26 Апреля 2017
Ученые расшифровали древние записи о глобальной катастрофе
Ученые из Эдинбургского университета в Великобритании нашли каменные столбы с вырезанными на них рисунками
21:20
23 Апреля 2017
Страны не справляются со резким ростом спроса на университетское образование - ЮНЕСКО
В последние годы наблюдается стремительный рост спроса на университетское образование.
11:09
23 Апреля 2017
Уникальная диета "убивает" рак и диабет
Новое исследование показывало, что содержание высокого содержания жиров может обратить вспять агрессивные виды рака
15:54
20 Апреля 2017
Яндекс.Деньги посчитали расходы жителей Армении в магазинах и ресторанах
Аналитики Яндекс.Денег выяснили, сколько тратят на еду жители Армении и в какие рестораны они ходят чаще всего
12:04
20 Апреля 2017
Ученые обнаружили новую причину вымирания мамонтов (ВИДЕО)
Ученые из Австралии, Канады, Норвегии, России и США обнаружили свидетельства в пользу новой причины вымирания экосистем позднего плейстоцена, включающих в себя мамонтов.
19:38
19 Апреля 2017
Астрономы нашли гигантский двойник Юпитера
Международная группа астрономов обнаружила газовый гигант, который в три раза массивнее Юпитера
19:46
17 Апреля 2017
Физики назвали условие обнаружения землянами инопланетян
Физик Джей Олсон из Университета штата Айдахо в Бойсе (США) назвал условие для обнаружения современными жителями Земли разумных существ
14:04
17 Апреля 2017
Ученые обнаружили на юге Аргентины яйца динозавров
Внутри яиц сохранились останки эмбрионов динозавров
21:52
16 Апреля 2017
Ученые выявили секрет крепкого сна
Английский драматург Томас Деккер в XVI веке назвал сон "золотой цепью", связывающей наши тела и наше здоровье