Ющук Евгений Леонидович (yushchuk) wrote,
Ющук Евгений Леонидович
yushchuk

Categories:

Особенности языка запросов настольных поисковых программ. "За" и "Против".

Особенности языка запросов настольных поисковых программ Яндекс Десктоп и Copernic Desktop Search. «За» и «Против».

Автор Ющук Евгений Леонидович,
г.Екатеринбург. 18.04.2006г.


В ходе пользования бесплатной программой Яндекс Десктоп (версия 1.0.0 сборка 349, http://desktop.yandex.ru/) было выявлено несоответствие заявленного языка запросов фактическому. В публикациях к моменту проведения эксперимента указывалось, что Яндекс Десктоп позволяет использовать язык поиска поисковой машины Яндекс, однако практикой это не подтверждалось.

Нами была предпринята попытка выяснить, насколько на самом деле совпадает язык поиска этой поисковой системы для персонального компьютера с тем языком поиска, с которым работает «большой» Яндекс.

Одновременно мы решили сравнить этот язык с аналогичным языком известной бесплатной программой для поиска на персональном компьютере Коперник Десктоп (Copernic Desktop Search, версия 1.6, сборка 740, http://www.copernic.com/en/products/desktop-search/index.html).

Обе программы предварительно индексируют информацию на компьютере, поэтому результаты поиска по проиндексированным документам выдают практически мгновенно.
Вместе с тем, в одном из наших экспериментов было показано, что Яндекс Десктоп передает некоторую (некритичную) информацию с компьютера пользователя на сервер Яндекса, тогда как Коперник не передает ничего вообще.

Интерфейс Коперника англоязычный, Яндекса – русскоязычный.

Как проводился эксперимент.
На жесткий диск персонального компьютера были записаны четыре файла, созданных в Word и содержавших короткие, достаточно бессмысленные тексты, включающие в себя нестандартные, редко встречающиеся слова, а также слова, намеренно написанные с орфографическими ошибками. Это позволило работать без «информационного мусора», который мог быть создан другими файлами, хранящимися на том же компьютере.

Текст, содержавшийся в этих файлах, а также поисковые запросы и результаты обработки этих запросов приведены в конце статьи.

Выводы:
На наш взгляд, программа Copernic Desktop Search обеспечивает больше возможностей для точного поиска на персональном компьютере, нежели Яндекс Десктоп.
Коперник Десктоп больше подходит для человека, который знает, что такое Булева алгебра и которого не смущает англоязычный интерфейс.

Яндекс, на наш взгляд, за счет упрощения языка запросов настольной поисковой программы, утратил свое главное преимущество – возможность составить точный поисковый запрос.

Если же пользователь не испытывает необходимости в составлении точного запроса, то Яндекс Десктоп – лучшее решение, чем продукт Коперника, поскольку он прощает большее количество ошибок и неточностей.

Особенности фактического языка запросов обеих испытанных программ.
Яндекс Десктоп
1. Яндекс воспринимает слова в любой словоформе и нет возможности отменить изменение словоформ. Причем, не работает ни оператор '!' перед словом, ни заключение слова в двойные кавычки.
2. Нет различий между заглавной и прописной буквами в тексте.
3. Ищет по целому слову, изменяя его словоформы, по фрагменту не ищет.
4. Принудительное включение слова в результат поиска не действует. Если из двух слов, соединенных логическим «И» в пределах текста есть только одно слово, этот текст все равно попадет в выдачу, даже если перед обоими словами стоит знак «плюс».
5. Оператор логическое «И» внутри одного предложения (‘&’) при этом действует.
6. Оператор расстояния между словами не действует
7. Логическое «НЕ» существует, но всегда относится ко всему тексту (что соответствует двойной тильде ‘~~’)
8. Поиск точной фразы с помощью оператора 'двойные кавычки' работает (несмотря на то, что применительно к отдельному слову этот оператор результата не дал).  Возможно, дело в том, что ищется точная последовательность слов, а не в том, что сохраняются их словоформы.
9. Логическое «ИЛИ» действует.

Коперник Десктоп.
1. Зависит от того, с заглавной или прописной буквы написано слово. Эта зависимость исчезает, если перед словом поставить логическое «ИЛИ» (оператор OR – заглавными буквами)
2. Ищет по фрагменту слова.
3. Словоформы не поддерживает. Если нужно слово в любой словоформе, надо написать его не до конца, чтобы все варианты окончаний могли быть добавлены к этому фрагменту.
4. Если в запросе два слова связаны логтческим «И», то в выдаче присутствуют только те тексты, в которых обязательно есть оба слова (опять напомню: не забудьте, что лучше писать слово без окончания, если не уверены, в какой словоформе оно присутствует в тексте).
5. Логическое «НЕ» представлено знаком «минус» и распространяется на любое место текста.

Тексты, участвовавшие в эксперименте.

Документ 1
Глоклая куздра сидела в шестисотпятидесятиметровом пространсте, когда мимо нее проехал чадящий и постреливающий глушителем Запорожец.


Документ 2
Глоклая куздра сидела в шестисотпятидесятиметровом пространсте, когда мимо нее проехал чадящий и чихающий Запорожец.


Документ 3
Глоклая куздра сидела в шестисотпятидесятиметровом пространсте, когда мимо нее проехал чадящий и чихающий Кадиллак.


Документ 4
Глоклой куздре в шестисотпятидесятиметровом пространсте было тесно.

Это проявлялось особенно сильно в особенности, когда она видела вблизи Запорожец.
Кадиллак тоже производил на нее подобное впечатление.
И только к уазику она относилась с пиететом, но без парализующего страха в лодыжках


Запросы и результаты.

Запросы в Яндекс Десктоп

Запрос: куздра
Результат: все четыре документа

Запрос: запорожец Кадиллак
Результат: три документа. Нет документа №4

Запрос: +запорожец +Кадиллак
Результат: три документа. Нет документа №4

Запрос: !Глоклой !куздре
Результат: все четыре документа

Запрос: +запорожец && +Кадиллак
Результат: три документа. Нет документа №4

Запрос: запорожец & Кадиллак
Результат: нет документов

Запрос: запорожец /20 кадиллак
Результат: Нет документов

Запрос: уазику
Результат: один документ №4

Запрос: !уазик
Результат: один документ №4

Запрос: запорожец ~ Кадиллак
Результат: три документа Нет документа № 3 и еще куча посторонних документов

Запрос: запорожец ~ кадиллак && +шестисотпятидесятиметровом
Результат: документы без слова «шестисотпятидесятиметровом» в выдаче присутствуют

Запрос: +запорожец ~~ +кадиллак && +шестисотпятидесятиметровом
Результат: документы без слова «шестисотпятидесятиметровом» в выдаче присутствуют

Запрос: "только к уазику она относилась"
Результат: только один документ №4

Запрос: "шестисотпятидесятиметровом пространсте было тесно"
Результат: только один документ №4

Запрос: "чадящий и чихающий Запорожец"
Результат: только один документ №2

Запрос: "глоклой куздре"
Результат: все документы

Запрос: "глоклой куздре" && Кадиллак
Результат: все документы

Запрос: запорожец ~ тесно
Результат: три документа, без документа №4

Запрос: глоклая чихающий
Результат: все четыре документа

Запрос: пространте ~ (глушителем | тесно)
Результат: ни одного документа

Запрос: пространсте ~ (глушителем | тесно)
Результат: все четыре документа


Запросы в Коперник Десктоп.


Запрос: куздра
Результат: три документа, нет документа №4

Запрос: куздр
Результат: все четыре документа

Запрос: запорожец AND Кадиллак
Результат: нет документов

Запрос: Запорожец AND Кадиллак
Результат: один документ №4

Запрос: Запорожец Кадиллак
Результат: один документ №4



Запрос: +запорожец +Кадиллак
Результат: нет документов

Запрос: Глоклой куздре
Результат: документ №4 (подчеркнуты оба слова)

Запрос: глоклой куздре
Результат: нет документов

Запрос: куздре Глоклой
Результат: документ №4


Запрос: уазику
Результат: документ №4

Запрос: уазик
Результат: документ №4

Запрос: Уазик
Результат: нет документов


Запрос: запорожец -Кадиллак
Результат: нет документов

Запрос: Запорожец -Кадиллак
Результат: документы №1 и №2

Запрос: "только к уазику она относилась"
Результат: документ №4

Запрос: "шестисотпятидесятиметровом пространсте было тесно"
Результат: документ №4

Запрос: "чадящий и чихающий Запорожец"
Результат: документ №2


Запрос: "глоклой куздре"
Результат: нет документов

Запрос: "Глоклой куздре" Кадиллак
Результат: Документ №4

Запрос: Запорожец -тесно
Результат: документ №1 и №2

Запрос: Глоклая чихающий
Результат: документ №2 и №3

Запрос: пространте ~ (глушителем OR тесно)
Результат:

Запрос: уазик OR Кадиллак
Результат: документ №3 и №4


Запрос: уазик OR запорожец
Результат: документ №4 , НО! При этом слово Запорожец, написанное с большой буквы, также подчеркнуто.

Запрос: уазик запорожец
Результат: нет документов

Статья Google без секретов (операторы Гугла в практических примерах)

Статья «Кадровая дилемма в конкурентной разведке: «Маркетологи» или «Безопасники»

На главную страницу сайта "Конкурентная разведка для работающих в российском бизнесе"


Открытый мастер-класс Ющука Евгения Леонидовича. Ющук Евгений Леонидович
"Конкурентная разведка против PR в живом эфире". В порядке ответа на
"Черный список", автор которого Кузнецов Сергей Валентинович
Депутат Леонид Волков (Екатеринбург). Практика сочетания юридических и информационных методов управления репутацией в Интернете. Кузнецов Сергей Валентинович
Tags: Бизнес-разведка, Евгений Ющук, Конкурентная разведка, Маркетинг, Ющук Евгений Леонидович
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 9 comments