486.32
+0.4
519.1
+4.61
8.21
+0.05
-7
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
21:24
17 Января 2017
Исландские генетики доказали вымирание образованных людей
Ученые выявили причину наблюдаемой закономерности
17:21
17 Января 2017
Армянские ученые могут решить задачи любой сложности в оборонной сфере
Армянские ученые могут решить любые сложные проблемы в оборонной сфере, сказал во вторник журналистам председатель Госкомитета по науке министерства образования и науки Армении Самвел Арутюнян.
14:31
17 Января 2017
Армянские дети чувствуют себя комфортно в волшебном мире науки
Дети в Армении действительно заинтересованы в естественных науках и довольно комфортно чувствуют себя в волшебном мире науки, заявила детского научного клуба "Маленький Эйнтштейн" Марина Григорян.
17:02
16 Января 2017
Атака трёхметрового слепоглухонемого монстра (ВИДЕО)
Канал Smithsonian Channel опубликовал видео охоты трёхметрового пурпурного австралийского червя (Eunice aphroditois).
13:28
15 Января 2017
Автор латинской транскрипции китайского языка умер в 111 лет
Китайский ученый Чжоу Югуан, создавший пиньинь - самую популярную на сегодняшний день систему латинской транскрипции мандаринского диалекта китайского языка, скончался в Пекине
12:22
15 Января 2017
SpaceX запустила ракету Falcon 9 со спутниками на борту
Это первые успешные пуск ракеты и приземление первой ступени после взрыва Falcon 9 в сентябре
15:27
14 Января 2017
Ученые определили возраст Луны
Согласно прежним оценкам, формирование спутника Земли произошло от 150 до 200 млн лет после образования Солнечной системы
20:24
12 Января 2017
Европейцы могут присвоить роботам статус "электронной личности"
Парламентарии ясно дали понять, что, по их мнению, мир стоит на пороге новой промышленной революции роботов
18:55
11 Января 2017
В Египте обнаружены 12 гробниц со скелетами детей и животных
Археологи обнаружили 12 древнеегипетских гробниц времен Нового Царства (1550-1069 год до нашей эры) на территории деревни Гебель-эль-Силсила
21:11
10 Января 2017
Японские ученые определили "недостающий элемент" ядра Земли
Японские ученые полагают, что им удалось определить элемент химического состава ядра Земли, который исследователи пытаются идентифицировать уже много лет
17:23
10 Января 2017
Жители Земли увидят ярчайший взрыв от рождения сверхновой
Группа астрономов из США предсказала один из ярчайших взрывов сверхновой в ближайшем будущем
14:25
10 Января 2017
Ученые разрабатывают устройства для глубокой стимуляции головного мозга
В мире активизировались разработки устройств для пациентов с болезнью Паркинсона