понедельник, января 26, 2009

Параллельный корпус Слова 2.0

Спустя два года после открытия проекта запущена вторая версия «Параллельного корпуса переводов "Слова о полку Игореве"». По сравнению с тем, как ресурс выглядел в марте 2007 года, сделано с трудом поддающееся счёту количество качественных и количественных изменений. Теперь корпус содержит более 200 текстов (сейчас -- 204) на более чем 40 языках (считать ли разными языками оригинал и перевод Слова?). Есть разные формы представления текстов: классический, строками, вписанными в экран, которые можно перетаскивать (drag-and-drop) и в виде текстовых блоков (опять же передвигаемых по экрану), есть всплывающие подсказки с указанием источника текста.
Теперь есть поиск -- по словам древнерусского текста (в выдаче сразу показаны не только контексты употребления слова, но и соответствующие статьи из Словаря-справочника Слова) и по русским переводам (создан совместно с А.А. Беловым).
Есть теперь возможность сообщить о замеченной ошибке в тексте корпуса с помощью специальной формы. Правда, при этом придётся пройти небольшой тест на статус человеческого существа (тест предоставлен гражданином Тьюрингом).
Если говорить о цифрах, то на данный момент в базе фрагментов 44472 записи, а в русских переводах словоформ оказалось примерно 30000. Все те замечательные люди, которые в той или иной мере участвовали в создании и развитии корпуса, по возможности указаны на соответствующей странице. Хотя я мог и забыть кого-то.
Несмотря на то, что корпус вышел внушительный, оцифровано далеко не всё. Многое из того, что пока осталось за рамками проекта, но что мы ещё надеемся когда-нибудь оцировать и ввести в корпус наравне с другими текстами, перечислено здесь. Список, увы, большой и, видимо, он будет расти. Остаётся надеяться, что расти он будет медленнее, чем сокращаться.

Комментариев нет: