485.25
-0.08
569.44
-2.72
8.18
-0.02
+3
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
09:56
11 Декабря 2017
Ученые обнаружили неожиданную опасность недосыпания
Ученые Йельского университета выяснили, что к чему может привести недосыпание
10:15
08 Декабря 2017
Ученые нашли предел возможностей человеческого организма
Французские ученые определили предельные возможности человеческого организма
21:29
07 Декабря 2017
Ученые обнаружили неожиданные последствия частого приема болеутоляющих
Ученые Ньюкаслского университета в Великобритании выяснили, к чему может привести частый прием болеутоляющих средств
21:23
05 Декабря 2017
Ученые обнаружили признак скорой смерти
Специалисты проанализировали электронные медицинские записи 46 тысяч британцев, которые умерли в возрасте 60 лет и старше
11:32
04 Декабря 2017
Исследователи назвали опасные последствия ожирения
Исследователи из Бристольского университета пришли к выводу, что имеющиеся оценки смертности от ожирения являются недооцененными
19:08
03 Декабря 2017
NASA обнародовало снимок таинственных облаков на Юпитере (ФОТО)
NASA опубликовало эффектную фотографию необычных облаков в северном полушарии Юпитера
09:06
03 Декабря 2017
Чем опасен отказ от завтрака
Согласно выводам специалистов, потребление завтрака вызывает правильную экспрессию генов, которые должны включаться в определенное время суток
18:50
01 Декабря 2017
"Роскосмос" перепутал Байконур и Восточный: сгорел спутник
Источник в космической отрасли рассказал о предварительных выводах, полученных в ходе анализа телеметрической информации аварийного пуска ракеты "Союз-2.1б"
09:43
01 Декабря 2017
В районе секретной Зоны 51 в США замечена странная активность
В окрестностях Зоны 51 энтузиастам и журналистам за последние полтора года удалось сделать ряд наблюдений
21:09
30 Ноября 2017
Ученые раскрыли происхождение снежного человека
Ученые раскрыли происхождение йети — похожего на человека существа, наблюдаемого, в частности, в Гималаях
20:15
30 Ноября 2017
Исследователи нашли универсальный способ продления жизни
Американские, британские и нидерландские ученые нашли универсальный способ продления жизни
17:01
29 Ноября 2017
Ученые доказали возможность возникновения космических объектов рядом с черными дырами
Группа астрономов из Северо-Западного университета смогли найти 11 активных протозвезд неподалеку от сверхмассивной черной дыры, которая находится в центре Млечного Пути