Добавить материал и получить бесплатное свидетельство о публикации в СМИ
Эл. №ФС77-60625 от 20.01.2015
Инфоурок / Другое / Тесты / Московская городская научно-исследовательская конференция «МАТЕМАТИКА: ЗНАНИЕ И РЕАЛЬНОСТЬ» в области естественно-математических наук, 2014
ВНИМАНИЮ ВСЕХ УЧИТЕЛЕЙ: согласно Федеральному закону № 313-ФЗ все педагоги должны пройти обучение навыкам оказания первой помощи.

Дистанционный курс "Оказание первой помощи детям и взрослым" от проекта "Инфоурок" даёт Вам возможность привести свои знания в соответствие с требованиями закона и получить удостоверение о повышении квалификации установленного образца (180 часов). Начало обучения новой группы: 26 апреля.

Подать заявку на курс
  • Другое

Московская городская научно-исследовательская конференция «МАТЕМАТИКА: ЗНАНИЕ И РЕАЛЬНОСТЬ» в области естественно-математических наук, 2014

Краткое описание документа:

Организаторами Конференции являются:

Департамент образования города Москвы,

Северо-Восточное окружное управление образованием,

Московский государственный университет путей сообщения (МИИТ),

Московский государственный технологический университет «СТАНКИН»,

ГБОУ гимназия № 1572

 

«Исследование механизмов индексирования и поиска текстовых документов». 11 класс

Автор: Щеколдина Дарья, ученица 11 А класса ГБОУ гимназии 1572.

Руководители: Кутукин Сергей Александрович, учитель информатики, Логинова Марианна Владимировна, учитель информатики.

Научный консультант: Андреев Арк Михайлович, к.т.н.

Основной задачей, возникающей при работе с полнотекстовыми базами данных, является поиск документов по их содержанию. Однако ставшие традиционными средства контекстного поиска по вхождению слов в документ, представленные, в частности, поисковыми машинами в Internet, зачастую не обеспечивают адекватный выбор информации по запросу пользователя.

Для успешного решения задачи регистрации неструктурированных текстовых данных и поиска этих данных по тексту в настоящей работе выполнены исследования возможных способов организации данных для их дальнейшего поиска, изучены механизмы индексирования и поиска текстовой информации. Также было проведено исследование возможностей улучшения качества поиска.

Интеллектуализация систем поиска текстовой информации требует учета ее смыслового содержания. Классические проблемы поиска документов – это синонимия (одно и то же понятие может быть выражено с использованием разных терминов – синонимов) и полисемия (один и тот же термин может иметь различные значения в различных контекстах). Традиционно эти проблемы решают путем расширения запроса семантически близкими словами из тезаурусов или из документов, возвращенных системой в ответ на запрос и помеченных пользователем как релевантные.

Ручное конструирование лингвистических ресурсов типа тезаурусов и онтологий (например, WordNet) очень трудоемко. Поэтому привлекательны автоматические методы получения и представления семантической информации. Ряд таких методов основан на использовании векторных моделей, где информация о совместной встречаемости слов извлекается из больших коллекций (корпусов) текстов и фиксируется в так называемых семантических или контекстных векторах. Сходство контекстных векторов, вычисляемое как скалярное произведение или расстояние, принимают за меру семантической близости слов. Из контекстных векторов формируются представления документов и запросов, которые отражают не только набор составляющих их слов, но и их семантику (смысл). Сходство таких представлений позволяет системе найти документы, которые могут и не содержать слов запроса, но соответствуют запрашиваемой теме.

Реализация результатов исследования позволяет повысить скорость и качество поиска текстовых документов.

Автор
Дата добавления 13.02.2015
Раздел Другое
Подраздел Тесты
Просмотров272
Номер материала 384889
Получить свидетельство о публикации

"Инфоурок" приглашает всех педагогов и детей к участию в самой массовой интернет-олимпиаде «Весна 2017» с рекордно низкой оплатой за одного ученика - всего 45 рублей

В олимпиадах "Инфоурок" лучшие условия для учителей и учеников:

1. невероятно низкий размер орг.взноса — всего 58 рублей, из которых 13 рублей остаётся учителю на компенсацию расходов;
2. подходящие по сложности для большинства учеников задания;
3. призовой фонд 1.000.000 рублей для самых активных учителей;
4. официальные наградные документы для учителей бесплатно(от организатора - ООО "Инфоурок" - имеющего образовательную лицензию и свидетельство СМИ) - при участии от 10 учеников
5. бесплатный доступ ко всем видеоурокам проекта "Инфоурок";
6. легко подать заявку, не нужно отправлять ответы в бумажном виде;
7. родителям всех учеников - благодарственные письма от «Инфоурок».
и многое другое...

Подайте заявку сейчас - https://infourok.ru/konkurs


Выберите специальность, которую Вы хотите получить:

Обучение проходит дистанционно на сайте проекта "Инфоурок".
По итогам обучения слушателям выдаются печатные дипломы установленного образца.

ПЕРЕЙТИ В КАТАЛОГ КУРСОВ


Идёт приём заявок на международный конкурс по математике "Весенний марафон" для учеников 1-11 классов и дошкольников

Уникальность конкурса в преимуществах для учителей и учеников:

1. Задания подходят для учеников с любым уровнем знаний;
2. Бесплатные наградные документы для учителей;
3. Невероятно низкий орг.взнос - всего 38 рублей;
4. Публикация рейтинга классов по итогам конкурса;
и многое другое...

Подайте заявку сейчас - https://urokimatematiki.ru

Похожие материалы

Включите уведомления прямо сейчас и мы сразу сообщим Вам о важных новостях. Не волнуйтесь, мы будем отправлять только самое главное.
Специальное предложение
Вверх