486.95
+0.14
513.34
-3.7
8.4
-0.03
-3
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
14:30
21 Февраля 2017
Ученые испытали новое обезболивающее из яда улиток
Яд маленьких улиток-конусов может быть использован для облегчения хронической боли, полагают американские ученые.
20:34
20 Февраля 2017
Как испанцы уничтожили цивилизацию ацтеков - новая версия
Цивилизация ацтеков погибла после прихода испанских конкистадоров, но армия из нескольких сотен солдат не могла уничтожить 25-миллионное население великой империи. Ученые предложили новое объяснение этой загадке.
17:03
17 Февраля 2017
Геологи обнаружили восьмой континент Земли
Площадь нового континента занимает порядка пяти миллионов квадратных километров
20:30
16 Февраля 2017
Ученые спрогнозировали катастрофическое землетрясение в США
Ученые провели компьютерное моделирование, чтобы определить точную форму разлома
22:28
12 Февраля 2017
Ужин на сон грядущий: Топ-5 полезных и вредных для хорошего сна продуктов
Некоторые продукты полезно есть перед сном, а вот от других стоит отказаться
20:17
12 Февраля 2017
Искусственный интеллект vs человек: угроза или помощник?
Уже сейчас раздаются призывы обдумать этические принципы разработки искусственного интеллекта, удостоверившись в том, что искусственный интеллект развивается в безопасном для людей направлении
19:46
12 Февраля 2017
Ученые рассказали, какой продукт наиболее полезен для сердца
Продукт отличается максимальным уровнем содержания полиненасыщенных жирных кислот, необходимых для профилактики сердечно-сосудистых заболеваний
21:22
11 Февраля 2017
Геофизики выявили причины последнего массового вымирания
Канадские и американские геофизики выявили новые подробности последнего великого вымирания
20:47
10 Февраля 2017
Ученые исследуют крики орангутанов для изучения эволюции языка
Ученые пришли к выводу, что звуки, которые издают орангутаны - один из наиболее близких к человеку вид человекообразных обезьян - могут пролить свет на происхождение языка.
21:11
09 Февраля 2017
На YouTube обнаружена "крупнейшая ошибка в истории"
На видеохостинге YouTube создали странный защитный механизм
20:35
09 Февраля 2017
Астрофизики вблизи Млечного Пути обнаружили "галактический мост" длиной 43 тыс. световых лет
Британские, итальянские и австралийские астрономы обнаружили "галактический мост", соединяющий два крупнейших спутника Млечного Пути
11:30
09 Февраля 2017
Геологи назвали сроки наступления кислородной катастрофы на Земле
Исследование опубликовано в журнале Proceedings of the National Academy of Sciences.