Инфоурок / Другое / Тесты / Московская городская научно-исследовательская конференция «МАТЕМАТИКА: ЗНАНИЕ И РЕАЛЬНОСТЬ» в области естественно-математических наук, 2014
Обращаем Ваше внимание: Министерство образования и науки рекомендует в 2017/2018 учебном году включать в программы образовательные события, приуроченные к году экологии (2017 год объявлен годом экологии в Российской Федерации).

Учителям 1-11 классов и воспитателям рекомендуем принять участие в Международном конкурсе «Я люблю природу», приуроченном к году экологии. Все ученики будут награждены красочными наградными материалами, а учителя получат бесплатные свидетельства о подготовке участников и призёров международного конкурса.

СЕГОДНЯ (15 ДЕКАБРЯ) ПОСЛЕДНИЙ ДЕНЬ ПРИЁМА ЗАЯВОК!

Конкурс "Я люблю природу"

Московская городская научно-исследовательская конференция «МАТЕМАТИКА: ЗНАНИЕ И РЕАЛЬНОСТЬ» в области естественно-математических наук, 2014



Московские документы для аттестации!

124 курса профессиональной переподготовки от 4 795 руб.
274 курса повышения квалификации от 1 225 руб.

Для выбора курса воспользуйтесь поиском на сайте KURSY.ORG


Вы получите официальный Диплом или Удостоверение установленного образца в соответствии с требованиями государства (образовательная Лицензия № 038767 выдана ООО "Столичный учебный центр" Департаментом образования города МОСКВА).

ДИПЛОМ от Столичного учебного центра: KURSY.ORG


Очень низкие цены на курсы переподготовки от Московского учебного центра для педагогов

Специально для учителей, воспитателей и других работников системы образования действуют 65% скидки при обучении на курсах профессиональной переподготовки.

После окончания обучения выдаётся диплом о профессиональной переподготовке установленного образца с присвоением квалификации (признаётся при прохождении аттестации по всей России).

Подайте заявку на интересующий Вас курс сейчас: KURSY.ORG


Краткое описание документа:

Организаторами Конференции являются:

Департамент образования города Москвы,

Северо-Восточное окружное управление образованием,

Московский государственный университет путей сообщения (МИИТ),

Московский государственный технологический университет «СТАНКИН»,

ГБОУ гимназия № 1572

 

«Исследование механизмов индексирования и поиска текстовых документов». 11 класс

Автор: Щеколдина Дарья, ученица 11 А класса ГБОУ гимназии 1572.

Руководители: Кутукин Сергей Александрович, учитель информатики, Логинова Марианна Владимировна, учитель информатики.

Научный консультант: Андреев Арк Михайлович, к.т.н.

Основной задачей, возникающей при работе с полнотекстовыми базами данных, является поиск документов по их содержанию. Однако ставшие традиционными средства контекстного поиска по вхождению слов в документ, представленные, в частности, поисковыми машинами в Internet, зачастую не обеспечивают адекватный выбор информации по запросу пользователя.

Для успешного решения задачи регистрации неструктурированных текстовых данных и поиска этих данных по тексту в настоящей работе выполнены исследования возможных способов организации данных для их дальнейшего поиска, изучены механизмы индексирования и поиска текстовой информации. Также было проведено исследование возможностей улучшения качества поиска.

Интеллектуализация систем поиска текстовой информации требует учета ее смыслового содержания. Классические проблемы поиска документов – это синонимия (одно и то же понятие может быть выражено с использованием разных терминов – синонимов) и полисемия (один и тот же термин может иметь различные значения в различных контекстах). Традиционно эти проблемы решают путем расширения запроса семантически близкими словами из тезаурусов или из документов, возвращенных системой в ответ на запрос и помеченных пользователем как релевантные.

Ручное конструирование лингвистических ресурсов типа тезаурусов и онтологий (например, WordNet) очень трудоемко. Поэтому привлекательны автоматические методы получения и представления семантической информации. Ряд таких методов основан на использовании векторных моделей, где информация о совместной встречаемости слов извлекается из больших коллекций (корпусов) текстов и фиксируется в так называемых семантических или контекстных векторах. Сходство контекстных векторов, вычисляемое как скалярное произведение или расстояние, принимают за меру семантической близости слов. Из контекстных векторов формируются представления документов и запросов, которые отражают не только набор составляющих их слов, но и их семантику (смысл). Сходство таких представлений позволяет системе найти документы, которые могут и не содержать слов запроса, но соответствуют запрашиваемой теме.

Реализация результатов исследования позволяет повысить скорость и качество поиска текстовых документов.

Общая информация

Номер материала: 384889

Похожие материалы

Получите наградные документы сразу с 38 конкурсов за один орг.взнос: Подробнее ->>