481.35
+0.03
565.97
-1.55
8.4
-0.01
+13
Погода в Ереване
Рус
Пользователи интернета помогут оцифровать миллионы книг, не подозревая об этом
17:49
12 Сентября 2008

ЕРЕВАН, 12 сентября. /Новости-Армения/. Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science (http://dx.doi.org/10.1126/science.1160379).

Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы, передает РИА Новости.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут. –0--

Loading...
Материалы по теме
Другие материалы раздела
21:03
16 Октября 2017
Ученые назвали причину смертоносного рака
Ученые из Левенского католического университета в Бельгии выяснили, что провоцирует быстрый рост злокачественных опухолей
19:42
15 Октября 2017
Прорыв астрономов: обнаружены шесть новых галактик
Это открытие, по мнению ученых, является прорывом в сфере наблюдения галактик так называемой эпохи реионизации
16:51
14 Октября 2017
Землю ожидает гиперпотепление: грядет термальная катастрофа
Ученые определили концентрацию углекислого газа, при которой атмосфера нашей планеты начнет катастрофически нагреваться
20:14
13 Октября 2017
BBC: перед человечеством открывается огромный мир новых сверхвозможностей
Если людям дать возможность наблюдать, что происходит у них в мозгу, они быстро научатся снимать боль, улучшать себе настроение и распоряжаться невиданными умственными способностями
17:43
13 Октября 2017
Армения построит свой "Наукоград"
Разработчики концепции считают необходимость создания в Армении подобного вуза велением нынешнего технологического периода
14:54
13 Октября 2017
В Армении будут вестись исследования по ядерной безопасности и криминалистике
Центр ядерной безопасности и криминалистики откроется в Армении, сказал в пятницу журналистам председатель Госкомитета по науке министерства образования и науки Армении Самвел Арутюнян
10:01
13 Октября 2017
Ученые обнаружили эффективное средство для похудения
Ожирение в последние десятилетия приобрело масштабы глобальной эпидемии, которая затронула 2,2 миллиарда человек
20:57
11 Октября 2017
Ученые назвали безотказный способ улучшить работу мозга
Ученые из Бостонского университета в США назвали безотказный способ улучшить работу мозга
14:06
11 Октября 2017
В Ереване проходит уникальный семинар о технологиях секвенирования ДНК
Данные технологии имеют огромное значение в развитии современной медицины
21:13
10 Октября 2017
Земля окажется под ударом новой магнитной бури
К Земле приближается новая порция солнечного ветра
18:29
08 Октября 2017
Открыто новое удивительное свойство черного чая
Известно, что качественный черный чай, притом правильно заваренный - это кладезь биоактивных веществ
21:16
05 Октября 2017
Астрономы опровергли доказательство существования инопланетных цивилизаций
Астрономы из Копенгагенского университета в Дании опровергли существование инопланетных цивилизаций