Тема: #20905
2003-05-05 06:29:00
Сообщений: 0
Оценка: 0.00
Христос Воскресе! Дорогия братья и сестры, нужна ваша помощь. Наш недавно созданный проект «Православная OCR Лаборатория» (OcrLab) ищет сотрудничества с людьми желающими принять участие в развитии православного русскоязычного интернета, тем самым способствуя проповеди Евангелия. Цель OcrLab -- подготавливать качественную православную литературу для публикации в православных онлайн-библиотеках. С технологической стороны OcrLab представляет из себя веб-интерфейс к программам распознования текса (OCR). Такой подход имеет ряд преимуществ: 1) Он позволяет многим людям одновременно работать над одной книгой, тем самым многократно ускоряя процесс ее обработки. 2) Он позволяет работать над подготовкой книг самому широкому кругу людей. Все, что для этого надо – компьютер и выход в интернет. Не надо ни специального оборудования (сканера), ни специальных программ (FineReader, AfterScan и т.д.), ни специальных знаний. 3) Он позволяет каждому желающему принести реальную пользу, затратив даже совсем немного времени. Ведь, если работаешь в одиночку, то пока не закончил всю книгу -- пользы никакой. А если вычитал, скажем, двести страниц из трехсот, а потом по каким-то причинам пришлось отложить работу? Труда затрачено много, а результат нулевой. В рамках же нашего проекта, даже если человек вычитает всего 2-3 страницы, его труд не пропадет! 4) Так как все книги готовятся стандартизированым образом, повышается качество их подготовки, нет необходимости каждому изобретать велисопед и повторять одни и те же ошибки. Это также упрощает жизнь людям, поддерживающим онлайн-бибилиотеки. Мы начали работу над этим проектом около трех месяцев назад. За это время мы успешно протестировали его в небольшом кругу участников, подготовив 4 книги (сейчас заканчиваем работу над пятой) общим объемом около 1500 страниц. Сейчас пришло время расширяться, и мы приглашаем к сотрудничесву всех желающих. Если найдется 100 человек, готовых уделять всего 5-10 минут в день этому проекту (т.е. вычитывать 2-3 страницы), то это уже получится 200-300 страниц в день или пол-книги среднего размера (каждая страница в нашем проекте вычитывается дважды и разными людьми, чтобы повысить качество вычитки). Аналогичные проекты в англоязычном интернете существуют давно и весьма успешно, позволяя обрабатывать таким образом по 3-5 тысяч страниц в день. В общем, добро пожаловать на сайт нашего проекта «Православная OCR Лаборатория»! http://pravbeseda.org/ocrlab