480.39
+0.17
536.6
+0.48
8.07
+0.03
+19
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
21:33
25 Июня 2017
Ученые в 2017 году выявили 5 неожиданных открытий о сердце
Эксперты также назвали самые полезные для сердца человека продукты
21:14
22 Июня 2017
Астрономы не исключают существование второго Марса в Солнечной системе
Астрономы из Аризонского университета допустили существование в Солнечной системе десятой планеты
19:55
22 Июня 2017
Google был заблокирован в России
Одна из страниц Google была внесена в реестр запрещенных сайтов из-за того, что с нее происходило перенаправление на сайт букмекерской конторы
15:20
22 Июня 2017
Инженерный форум-выставка впервые пройдет в Армении
Первый специализированный Инженерный форум-выставка пройдет 24-го июня в Армении, сообщил глава фонда "Инкубатор предприятий" Баграт Енгибарян
09:47
21 Июня 2017
Апокалипсис не за горами: климатологи ждут смертельную для человечества жару
По мнению ученых, люди вряд ли успеют приспособиться к новым условиям
13:25
19 Июня 2017
NASA обнаружило, что Черное море изменило свой цвет (ФОТО)
NASA опубликовало свежие фотографии Черного моря, сделанные со спутника. Согласно выводам специалистов, главная российская акватория изменила свой цвет
15:52
17 Июня 2017
В Китае осуществили квантовую телепортацию между Землей и космосом
В Китае осуществили квантовую телепортацию между космосом и Землей на расстояние более 1,2 тысячи километров
15:06
16 Июня 2017
Суперсовременная лаборатория молекулярной генетики появится в Ереване
Суперсовременная лаборатория молекулярной генетики откроется на факультете биологии Ереванского государственного университета
21:23
15 Июня 2017
Ученые предрекли катастрофу в бассейне самой полноводной реки мира
Наступление катастрофы спрогнозировали ученые из Бразилии, Германии, Сингапура, Великобритании и США
21:14
15 Июня 2017
"Звездные врата" открылись в армянском Бюракане
На территории Бюраканской астрофизической  обсерватории открылись "Звездные врата"
20:19
15 Июня 2017
Ученые нашли точное местоположение восьмого чуда света
Ранее специалисты полагали, что восьмое чудо света может находиться, в частности, на дне Ротомахана
16:18
09 Июня 2017
Армения запустила официальный сайт WCIT 2019 (ВИДЕО)
Запущен официальный сайт Всемирного конгресса по информационным технологиям (WCIT), который пройдет в Армении в октябре 2019-го года