?

Log in

No account? Create an account
Ющук Евгений Леонидович

Ноябрь 2017

Вс Пн Вт Ср Чт Пт Сб
   1234
567891011
12131415161718
19202122232425
2627282930  

Конкурентная разведка (Competitive Intelligence)

Теги блога "Конкурентная разведка"

Разработано LiveJournal.com
Ющук Евгений Леонидович

Google без секретов (операторы Гугла в практических примерах)

ВНИМАНИЕ: в статью периодически вносятся дополнения и изменения, отражающие изменения в Гугле. Актуальная версия статьи расположена здесь. Я РЕКОМЕНДУЮ ПЕРЕЙТИ К АКТУАЛЬНОЙ ВЕРСИИ МАТЕРИАЛА.

Эта статья написана для тех, кто пользуется Гуглом (Google) для поиска информации в Интернете и хочет научиться делать это еще более качественно и профессионально.


Гугл становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по информации из интервью инженера по программному обеспечению Google Мэта Катса уже в 2002 году «каждые 28 дней Google индексировал 3 миллиарда веб-документов, в том числе более трех миллионов новых страниц каждый день».

В своей работе в качестве бизнес-тренера я не раз сталкивался с тем, что отсутствие русскоязычного хэлпа затрудняет работу пользователей. Работа Дениса (liveuser) http://www.livejournal.com/community/kubok/45852.html по поиску через Яндекс подтвердила востребованность и практическую полезность подобных статей, как и тот факт, что не всё, написанное в хэлпах поисковых систем, своевременно обновляется.

Так была написана статья, предлагаемая вашему вниманию.

Здесь на конкретных примерах рассказывается об операторах запросов Гугла.

Основы поиска
Чтобы ввести запрос, напечатайте ключевые слова и нажмите ENTER, либо щелкните кнопку «Поиск в Google».

Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого Гугл анализирует не только саму страницу, которая соответствует запросу, но и страницы, которые на нее ссылаются, чтобы определить ценность этой страницы для целей вашего запроса. Кроме того, Гугл предпочитает страницы, на которых ключевые слова. Введенные вами, расположены недалеко друг от друга.

Показ ключевых слов в результатах.
Каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова. Тем самым облегчается обнаружение ключевых слов в тексте.

Второй способ увидеть ключевые слова – загрузить страницу по ссылке «Сохранено в кэше». Недостаток этого способа (а иногда это рассматривается как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла.

Третий способ – традиционный для просмотра текста в браузере – использовать сочетание клавиш CTRL+F. Появится окно «найти» , в которое вводятся искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.

Логическое «И».
По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса. Это соответствует оператору AND

Например:
[Кошки собаки верблюды зебры носороги]

Пример результата, сохраненного в кэше, можно видеть на странице:
{Нажмите здесь, чтобы увидеть результат}


Логическое «ИЛИ»
Пишется с помощью оператора OR. Обратите внимание, что оператор OR должен быть написан заглавными буквами. Относительно недавно появилась возможность написания логического «ИЛИ» в виде вертикальной черты ( | ), подобно тому, как это делается в Яндексе.

Например:
[Таксы длинношерстные OR гладкошерстные]

Интересно, что Гугл может показать и те страницы, на кoтopыx нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу. В таком случае при просмотре страницы с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу: таксы длинношерстные гладкошерстные». Пример можно увидеть по адресу:

{Нажмите здесь, чтобы увидеть результат}


Заглавные буквы или прописные?
Гугл НЕ чувствителен к регистру букв. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Эйфелева Башня] и [эйфелева башня] дадут одинаковые результаты.

Пример результата на момент написания статьи:
Результаты 1 - 10 из примерно 91 900 для Эйфелева Башня.
Результаты 1 - 10 из примерно 91 900 для эйфелева башня.

Стоп-слова.
В хэлпах написано, что Гугл, подобно большинству поисковых машин, игнорирует стоп-слова. И, как и многие другие, имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, союзов и предлогов русского языка.

В реальности ситуация, похоже, изменилась.

Тест: вводим по-русски букву
[в]
. Результат:
Результаты 1 - 10 из примерно 48 600 000 для в.

Вводим по-английски артикль
[the]
. Результат:
Результаты 1 - 10 из примерно 8 670 000 000 для the.

Оператор «Плюс» (+)
Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву “I” (Ай). Если сделать запрос просто как

[Star Wars Episode I]

То результат будет
Результаты 1 - 10 из примерно 13 200 000 для Star Wars Episode I.
В том числе в выдаче появятся слова «Episode II», «Episode IV» и т.п.

Если сделать запрос:
[Star Wars Episode +I]

то результат будет
Результаты 1 - 10 из примерно 9 290 000 для Star Wars Episode +I.
И в него войдут только тексты, содержащие слово «Episode I»

Морфология слов.
Гугл НЕ поддерживает морфологию слов. Слова надо вводить в нужных словоформах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы убедиться в правильности утверждения об отсутствии поддержки морфологии, давайте возьмем словосочетание, по которому можно увидеть все без исключения результаты. На эту роль подходит «Глоклая куздра».

Тест:
Запрос:

[глоклая куздра]


Результаты 1 - 4 из примерно 16 для глоклая куздра.
В выдаче три адреса:

1. www.flame.ws/txt/index.php/t737.html



2. www.dom.no/modules.php?name=Forums&file=viewtopic&p=31986&highlight=



3. gb.anekdot.ru/vm.html?file=vm&date=1998-08-07


Запрос:

[глоклую куздру]


Результаты 1 - 1 из 1 для глоклую куздру.
В выдаче один адрес:

gb.anekdot.ru/vm.html?file=vm&date=1998-08-07


Запрос:

[глоклой куздре]


Результат: Не найдено ни одного документа, соответствующего запросу глоклой куздре.

      Правда, это не мешает Гуглу иногда выделять по запросу «площадь» слово «площади» как релевантное. Однако подобное выделение встречается на странице выдачи, но не в кэше.

Просто для сравнения, приведу результат Яндекса. По всем трем запросам Яндекс давал на момент написания статьи одинаковый результат:
Результат поиска: страниц — 13, сайтов — не менее 5

Улучшение запроса во время поиска.
Поскольку Гугл выдает все слова, которые вы вводите в запросе, имеет смысл составлять новые запросы, содержащие те слова, которые вы забыли ввести в начале поиска, но нашли в ходе его выполнения в найденных текстах. В ряде случаев это может помочь улучшить поиск. Если же добавлять эти слова к уже имеющемуся запросу, то можно иногда излишне сузить диапазон результатов.

Исключение слов из запроса. Логическое «НЕ».
Как известно, информационный мусор часто встречается при составлении запроса. Чтобы его удалить, стандартно используются операторы исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус». Используя этот оператор, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.

Тест:
Запрос:
[Журавль колодец]

Результаты 1 - 10 из примерно 778 для Журавль колодец.

Запрос:
[Журавль колодец –птица]

Результаты 1 - 10 из примерно 715 для Журавль колодец -птица.

Запрос:
[Журавль -колодец –птица]

Результаты 1 - 10 из примерно 120 000 для Журавль -колодец -птица.

Запрос:
[Журавль -колодец -птица –птиц]

Результаты 1 - 10 из примерно 106 000 для Журавль -колодец -птица -птиц.

Запрос:
[Журавль -колодец -птица -птиц –журавли]

Результаты 1 - 10 из примерно 104 000 для Журавль -колодец -птица -птиц -журавли.

Поиск точной фразы.
Искать точную фразу на практике требуется либо для поиска текста определенного произведения, либо для поиска определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание.

Чтобы справиться с такой задачей при помощи Гугла, требуется заключить запрос в кавычки (имеются в виду двойные кавычки, которые применяются, например, для выделения прямой речи).

Забавным, но показательным примером может быть задание из учебника русского языка для 7 класса под ред. Н.М. Шанского. На стр. 45 приведено задание разделить текст на абзацы. Автор – М.Шолохов. Произведение не указано. Вот фрагмент текста: [«За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.»]

Введем этот текст в кавычках в Гугл и получим следующий результат:

Результаты 1 - 10 из примерно 15 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.».



Как выяснилось, этот фрагмент относится к произведению Тихий дон / книга четвертая. А забавность примера в том, что у Шолохова этот текст оказался вообще не разбитым на абзацы.

Гугл воспринимает как знаки, связывающие слова в единую фразу, не только кавычки, но и такие символы, как дефис, слэш (косая черта), точка, знак равенства, апостроф.

Результаты 1 - 10 из примерно 27 400 для мать-и-мачеха.
Результаты 1 - 10 из примерно 27 300 для мать/и/мачеха.
Результаты 1 - 10 из примерно 27 300 для мать=и=мачеха.
Результаты 1 - 10 из примерно 27 300 для мать.и.мачеха.
Результаты 1 - 10 из примерно 27 300 для мать'и'мачеха.

Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже: «Мать-и-мачеха (Tussilago farfara) — одно из самых раноцветущих растений: зацветает в


... Как лекарственное растение мать-и-мачеха применяется, прежде всего, ...»

При этом все три слова - «мать», «и», «мачеха» рассматриваются как отдельные, но стоящие рядом и в этой последовательности. Пример можно увидеть на сохраненной в кэше странице по адресу:
{Нажмите здесь, чтобы увидеть результат}


Интересно, что по запросу [мать-и-мачеха] оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается:

Результаты 1 - 10 из примерно 27 300 для "мать-и-мачеха".

Чтобы прояснить этот казус, введем запрос такого вида:
[мать-и-мачеха -"мать-и-мачеха"]

Получим: Результаты 1 - 10 из примерно 27 для мать-и-мачеха -"мать-и-мачеха".

В выдаче появятся тексты такого содержания:

Санкт-Петербургская Федерация Настольного Футбола
Матьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий ...
Матьимачеха - игроки получают по 60 рейтинговых очков; Экспромт - игроки ...
www.kickerclub.spb.ru/tournaments/2005-09-03.html - 17k




      Количество слов в строке поиска.
      Во многих источниках встречается информация, что поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск только по 10 словам.

      В моем эксперименте эти данные не подтвердились. Так, введем запрос из 23 слов:

[крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр]

Результат:

Результаты 1 - 3 из примерно 5 для крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр.

Ресторан.Ru | Кулинария | Кулинарные рецепты | Вторые блюда | С ...
(салат, помидоры, огурцы, гамбургеры, булочки, сыр, майонез) ... (макароны, лук, перец, помидоры, мука, масло, рубленое мясо, мясной бульон, сыр) ...
www.restoran.ru/index.phtml?t=1&pid=2516

      В КЭШе подчеркнуты все 23 слова и в тексте они также присутствуют.

      Увидеть эту страничку из кэша можно по ссылке:


{Нажмите здесь, чтобы увидеть результат}


      Если изменить запрос, используя логическое «ИЛИ» вместо логического «И», то результат прогнозируемо меняется, но все слова в выдаче по-прежнему выделены Гуглом.

[крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр]

Результат:

Результаты 1 - 10 из примерно 3 430 000 для крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр.

В начале сентября 2006 г. появились публикации, в которых было сказано, что Гугл позволяет вводить в строку запроса не более 32 слов. Эта информация соответствует действительности.

Стемминг (а также wildcard).
Стемминг – возможность усечения слова до его корня. После усечения слова до его корня производится поиск релевантных вариантов слов, производных от этого корня. Другими словами, стемминг позволяет искать все однокоренные слова.

Техника поиска по маске (wildcard) предствавляет собой написание базового слова (или части слова), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова, либо когда вы хотите включить все возможные варианты слова в свой поиск.

Например, когда по запросу [тарт*]
получают как «тарталетку», так и «тартар».
      

Так вот, Гугл эти технологии НЕ поддерживает. Зато он поддерживает вариант, когда вместо ЦЕЛОГО СЛОВА вводится звездочка.

Например, по запросу:

[красная * площадь]

Будет выдано:
«Красная и Манежная площади», с подчеркиванием всех этих слов, в том числе буквы "и". В какой-то степени это похоже на поиск с расстоянием между словами.

По запросу:

[красная * площадь -"красная площадь"]

Будут получены результаты « Красная (Семеновская) площадь », где слово «Семеновская» не считается релевантным и не подчеркивается Гуглом.

Дополнительные операторы

Оператор cache:
Поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины и сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом.

Например:
«Это сохраненная в кэше G o o g l e копия страницы http://www.kickerclub.spb.ru/tournaments/2005-09-03.html, записанная 4 янв 2006 06:07:09 GMT.»

Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом.

Например, запрос:
[cache:www.bstm.ru] будет сразу выдавать версию страницы www.bstm.ru из кэша, а не проверять ее нынешнее состояние.

ВНИМАНИЕ: пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.

Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы.

Например:
[cache:www.bstm.ru библиотека]

Оператор info:
Оператор info: позволяет увидеть информацию, которая известна Гуглу об этой странице.

Например, запрос: [info:www.bstm.ru] дает следующий результат:

BSTM - Бизнес-школа технологий менеджмента | Екатеринбург : Новости
phpsm, phpsitemanager. ... Президентская программа. О программе • Стратегический
менеджмент • Менеджмент качества • Маркетинг на предприятии ...
www.bstm.ru/

Google может показать следующую информацию об этом адресе:

• Показать сохраненную в Google версию www.bstm.ru
• Найти страницы, похожие на www.bstm.ru
• Найти страницы, ссылающиеся на www.bstm.ru
• Найти страницы на сайте www.bstm.ru
• Найти страницы, упоминающие ссылку "www.bstm.ru"


ВНИМАНИЕ: пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.

Оператор site:
Этот оператор ограничивает поиск конкретным доменом. То есть, если сделать запрос:
[маркетинг разведка site:www.acfor-tc.ru]
то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «acfor-tc.ru» , а не в других частях Интернета .

Если сделать запрос
[scip site:ru]
то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».

ВНИМАНИЕ: пробела между оператором site: и URL’ом запрашиваемой страницы быть не должно.

Оператор link:
Этот оператор позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос.

Например, по запросу:

[link:www.livejournal.com/community/kubok/45852.html]
Будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.

ВНИМАНИЕ: пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.

Оператор allintitle:
Если запрос начать с оператора allintitle: , что переводится как «Все – в заголовке», то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML).

Например, запрос

[allintitle: википедия яндекс]
даст результаты, где слова «википедия» и «яндекс» содержится внутри тега Title на просмотренных поисковой машиной страницах.

На момент написания статьи результат был таким:
Результаты 1 - 3 из примерно 7 для allintitle: википедия яндекс.

Оператор intitle:
Показывает страницы, в кoтopыx только то слово, которое стоит непосредственно после оператора intitle: , содержится в заголовке, а все остальные слова запроса могут быть в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:

[intitle:википедия яндекс]
На момент написания статьи результат был таким:
Результаты 1 - 10 из примерно 888 для intitle:википедия яндекс.

ВНИМАНИЕ: пробела между оператором intitle: и последующим словом быть не должно.

Оператор allinurl:
Если запрос начинается с оператора allinurl: , то поиск ограничен теми документами, в которых все слова запроса содержатся только в адресе страницы, то есть в url.

Так, на момент написания статьи для запроса:

[allinurl: narod razvedka]
Результат был таким:
Результаты 1 - 10 из примерно 14 для allinurl: narod razvedka.

ВНИМАНИЕ: оператор allinurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, т.к. могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос

[allinurl: narod.razvedka] , равно как и [allinurl: narod/razvedka] результата не дал вообще.

Оператор inurl:
Слово, которые расположено непосредственно слитно с оператором inurl: , будет найдено только в адресе страницы Интернета, а остальные слова – в любом месте такой страницы.

Например, для того, чтобы найти слово «разведка » на сайтах, содержащих в адресе сочетание букв «tc», можно сделать такой запрос:

[inurl:tc razvedka]
Результат на момент написания статьи:
Результаты 1 - 1 из 1 для inurl:tc razvedka.

И был представлен текстом: «Otryady-5
Razvedka okazalas' neskol'ko utomitel'noi (obratno shli V lavirovku). Poetomu k
pirsu my podoshli sovershenno izmuchennye: no ne stol'ko samoi razvedkoi, ...
www-lat.rusf.ru/tc/tc08/08otr5.htm».

Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl:

ВНИМАНИЕ: пробела между оператором inurl: и и последующим словом быть не должно.

ВНИМАНИЕ: оператор inurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, т.к. могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос

[inurl:tc/razvedka] , равно как и [inurl:tc.razvedka] результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержаласть точная фраза «tc/razvedka» или «tc.razvedka». В этом можно убедится, введя запрос:

[inurl:kubok]
Результаты 1 - 10 из примерно 28 400 для inurl:kubok.

И этот результат начинается с текста: «Кубок Яндекса
Как искать эффективно • Вопросы и ответы • Предложение организаторам соревнований •
Форум • Кубок в LiveJournal kubok ...
kubok.yandex.ru/»

[inurl:kubok/45852]
Результаты 1 - 2 из примерно 44 для inurl:kubok/45852.


И этот результат начинается с текста: «kubok: Хозяйке на заметку
Хозяйке на заметку. Материал рассчитан на подготовленного читателя, знающего,
что такое стоп-слова и операнды, чем '~~' отличается от '&&' и зачем их ...
www.livejournal.com/community/kubok/45852.html»

Оператор related:
Этот оператор описывает страницы, которые «похожи» на какую-то конкретную страницу. Например, запрос

[related:it2b.ru]

Дает результат:
Результаты: 1 - 10 из приблизительно 29 подобных it2b.ru.

Я бы не сказал, что все страницы действительно подобны странице сайта it2b.ru , с точки зрения человека. Хотя некоторые страницы действительно посвящены подобной тематике.

Первым в выдаче стоит на самом деле сайт it2b.ru, посвященный вопросам использования технологий разведки для бизнеса. А вот вторым – сайт компании "SW-Trans", предлагающей услуги по перевозке грузов.

Могу предположить, что основанием для уподобления двух сайтов послужило упоминание на сайте грузовой компании услуг по охране грузов, их сопровождению машинами со спецсигналами, о спецпропусках и о «решении всех возможных дополнительных проблем, возникающих при транспортировке». Наряду с транспортной компанией, Гугл засчитал в подобные страницы и такие объяснимые ресурсы, как журнал «Sales/Business (Продажи)», в котором встречается немало публикаций о предпринимательских рисках и о конкурентной разведке, а также компанию «Информзащита», работающую в области обеспечения информационной безопасности.

ВНИМАНИЕ: пробела между оператором related: и и последующим словом быть не должно.

Оператор define:
Этот оператор выполняет роль своего рода толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.

Например:

[define: разведка]

Результат:

Определения разведка в интернете:
совокупность мер для сбора данных о действительном или возможном противнике.
www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html

Интересной особенностью оператора define: является его способность искать определения фразам. В качестве фразы он понимает все слова, написанные после оператора, в том числе и написанные без кавычек, просто через пробел

Например:

[define: большой взрыв]

Результат:

Определения большой взрыв в интернете:
Большой Взрыв — взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности.
ru.wikipedia.org/wiki/Большой_Взрыв

Правда, иногда этот оператор может и повеселить, либо дать материал для проведения КВН с вопросами, на которые мало кто ответит. Например, по запросу:

[define:ложка]

Результат:

Определения ложка в интернете:
* блесна, основанная на подражании раненой рыбке.
fisherman.com.ua/files/fishsay.php

А по запросу :

[define:осёл]

Результат:

Похожие фразы: буриданов осёл

Определения осёл в интернете:
* строгий, собранный в кучу, материал
astro.rin.ru/htmls/nostradamus/astro1826-5.html

ВНИМАНИЕ: наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.


Поиск синонимов.
В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».

Мне не удалось найти подтверждения этому утверждению.

Так, я сравнил два запроса и не нашел разницы:

[~опережающий ~разведка]
Результаты 1 - 10 из примерно 33 100 для ~опережающий ~разведка.

[опережающий разведка]
Результаты 1 - 10 из примерно 33 100 для опережающий разведка.


Поиск числовых значений.
Для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того, чтобы найти все страницы, содержащие числа в неком диапазоне «от - до», надо между этими крайними значениями поставить ДВЕ ТОЧКИ.

Например, по запросу

[численность населения 1913..1917]

Будут выданы страницы

Народная энциклопедия городов и регионов России. Города. Санкт ...
Подчиненные поселки городского типа, численность населения на 1.01.2000 ...
Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г. ...
rfdata.al.ru/auto/city/18/667.HTM

с выделенным числом «1914»

а также


Известия Уральского государственного университета № 9(1998 ...
За 192 года своего существования с 1723 по 1915 гг. численность населения города
увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город ...
proceedings.usu.ru/.../0009(03_05-1998)&xsln=showArticle.xslt&id=a14&doc=../content.jsp

С выделенным числом «1915»

Подобный пример приведен в хэлпе Гугла на примере цены DVD:

[DVD player $50..$100]

Кнопка «Мне повезет» (в английском варианте - "I'm Feeling Lucky")
Кнопка «Мне повезет» расположена на главной странице Гугла. На мой взгляд, это замечательная идея. По этой кнопке Гугл выдает наиболее релевантный, с его точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого.

Например, запрос по кнопке «Мне повезет»

[активные формы]

Открывает непосредственно сайт одноименной консалтинговой компании http://www.acfor.ru/



Расширенный поиск.

Для тех, кто в целом понимает, как работает поисковая машина, но не хочет запоминать операторы запросов, и при этом согласен на потерю части информации, подойдет страница расширенного поиска. Такие страницы, по мере развития и «поумнения» поисковых машин становятся всё более популярными не только у обывателей, но и у профессионалов конкурентной разведки, во всяком случае, на Западе.


Сводная таблица операторов Google, приведенных в статье. Открыть или загрузить файл Word размером 48кБ


Литература:


1. http://www.google.ru/support/bin/topic.py?topic=352


2. http://www.google.ru/support/bin/answer.py?answer=504&topic=352

3. http://www.google.ru/help/refinesearch.html

4. http://www.google.ru/help/operators.html

5. http://www.google.ru/help/interpret.html

6. http://www.google.com/help/basics.html

7. http://www.google.com/help/operators.html

8. http://www.google.com/help/refinesearch.html

9. http://propel.ru/pub/34.php

10.http://search.ufl.edu/user_help.html

11. http://www.cavendishpublishing.com/html/dxsearchfaqs.asp#help6

12.http://www.searchengines.ru/articles/004532.html

13.http://www.livejournal.com/community/kubok/45852.html

14. 3DNews.ru. «В гостях у Google `2006» 1 февраля 2006г.


15.Книга "Конкурентная разведка: маркетинг рисков и возможностей", Е.Л. Ющук. Москва, издательство деловой литературы "Вершина.", 2006г.

Ющук Евгений Леонидович, г. Екатеринбург, 08.01.2006г.


Продолжение статьи "Google без секретов (операторы Гугла в практических примерах)"


Статья Google без секретов (операторы Гугла в практических примерах)

Статья «Кадровая дилемма в конкурентной разведке: «Маркетологи» или «Безопасники»

На главную страницу сайта "Конкурентная разведка для работающих в российском бизнесе"


Открытый мастер-класс Ющука Евгения Леонидовича. Ющук Евгений Леонидович
"Конкурентная разведка против PR в живом эфире". В порядке ответа на
"Черный список", автор которого Кузнецов Сергей Валентинович



Кузнецов Сергей Валентинович



Подписаться на Telegram канал yushchuk

Comments

вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Яндекса

???

(Анонимно)

Гугл, ПОДДЕРЖИВАЕТ морфологию АНГЛИЙСКИХ слов
Леня
Re: Гугл, ПОДДЕРЖИВАЕТ морфологию АНГЛИЙСКИХ слов
Леня

Вот не могу я толком разобраться с этим вопросом.

Действительно, некоторые источники говорят, что Гугл английскую морфологию различает. Но начинаем проверять и как-то не очень получается. По крайней мере, в привычном нам смысле различения морфологии как автоматического определения, что вместе с единственным числом надо и слова во множественном числе считать релевантными.

Может быть, скажете источники Вашей информации? У меня получились такие результаты сравнения Гугла с Яндексом (который, как известно, морфологию слов понимает):

Запросы в Гугл.

Запросы:

[haberdasher] и [haberdashers]

Результаты 1 - 10 из примерно 161 000 для haberdasher.

Результаты 1 - 10 из примерно 139 000 для haberdashers.

Запросы:
[habitant] и [habitants]

Результаты 1 - 10 из примерно 3 060 000 для habitant
Результаты 1 - 10 из примерно 8 680 000 для habitants


Запросы в Яндекс:

Запрос:

[галантерейщик]
Результат поиска: страниц — 9 560, сайтов — не менее 1 656

[галантерейщики]
Результат поиска: страниц — 9 561, сайтов — не менее 1 657

Запрос:
[абориген]
Результат поиска: страниц — 843 596, сайтов — не менее 2 035

[аборигены]
Результат поиска: страниц — 839 574, сайтов — не менее 2 030
Спасибо, david_m, я исправил опечатку. Теперь это звучит: "вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла"
Стемминг - совсем не то же самое, что wildcard.
Спасибо, kukutz. Я исправил эту часть текста. Как Вы считаете, теперь нормально? Если нет, подскажите, что на Ваш взгляд надо сделать.
Сейчас в этом месте всё хорошо.
Спасибо!
Спасибо - оч. полезно. Только уберите текст под кат
Извините, vitcom, я не понял - что надо убрать?
очень длинный текст у Вас полчился. 2/3 всей страницы занимает. Спрячте часть текста под тег lj-cut (Text Here )
Спасибо! Получилось.

(Анонимно)

По поводу wildcard.

По поводу wildcard.
Мне кажется, что wildcard поддерживаются Googl'ом.
Вот пример http://www.google.com/search?q=%D0%BD%D0%B0%D1%87%D0%B0%D0%BB%D1%8C*&num=100&hl=ru&hs=WO4&lr=&c2coff=1&rls=en&start=200&sa=N
И ещё интересное явление. Если задать тот же запрос, но только по русским текстам, то результат другой. различные окончания слов не выделяются жирным шрифтом...
http://www.google.com/search?q=%D0%BD%D0%B0%D1%87%D0%B0%D0%BB%D1%8C*&num=100&hl=ru&hs=IQ4&lr=lang_ru&c2coff=1&rls=en&start=0&sa=N

Re: По поводу wildcard.

Действительно, любопытно. Но, на мой взгляд, здесь что-то другое. Не wildcard в чистом виде.

Вот запрос:

[глокла* куздр*]

а вот его результат:
Не найдено ни одного документа, соответствующего запросу глокла* куздр*.

Рекомендации:

* Убедитесь, что все слова написаны без ошибок.
* Попробуйте использовать другие ключевые слова.
* Попробуйте использовать более популярные ключевые слова.
* Попробуйте уменьшить количество слов в запросе.

Ещё запрос:
[голубой вагон бежит качается]

Результат:
Результаты: 1 - 100 из приблизительно 22 600 страниц на русском для голубой вагон бежит качается.

Первый в выдаче:
Голубой вагон. - аккорды песни ( Песни из мультфильмов )
Припев. Голубой вагон бежит, качается, Скорый поезд набирает ход... Ах, зачем же
этот день кончается, Пусть бы он тянулся целый год! ...
akkord.li.ru/goluboi_vagon_-3200-pesni_iz_multfilmov/ - 24k

Новый запрос:
[голубо* ваго* бежи* качаетс*]

Результат:
Не найдено ни одного документа, соответствующего запросу голубо* ваго* бежи* качаетс*.

Рекомендации:

* Убедитесь, что все слова написаны без ошибок.
* Попробуйте использовать другие ключевые слова.
* Попробуйте использовать более популярные ключевые слова.
* Попробуйте уменьшить количество слов в запросе.

Re: По поводу wildcard.

Хотя, что-то Гугл, похоже, пытается понять.

По запросу:
[нача*ьник]

Результат:
http://www.google.ru/search?hl=ru&q=%D0%BD%D0%B0%D1%87%D0%B0*%D1%8C%D0%BD%D0%B8%D0%BA&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=

При этом одна из страниц, сохраненных в кэше:
http://216.239.59.104/search?q=cache:9w5EDK46XcoJ:www.russa.ru/obia/otchizna/div/div1.html+%D0%BD%D0%B0%D1%87%D0%B0*%D1%8C%D0%BD%D0%B8%D0%BA&hl=ru

и на ней подчеркнуты как два разных фрагмента части слитно написанного слова 'начальник' в фразе "Начальник политотдела дивизии подполковник Сотников А.Т.;"

В других случаях попытка перейти в кэш может вообще не дать результата - Гугл говорит, что нет таких страниц у него.


Но с редкими словами Гугл ничего подобного не проделывает:

Запрос
[подвыподверт]

Результат:
Результаты 1 - 10 из примерно 208 для подвыподверт.

Первый в выдаче:
Глас Рассудка VIII - Трактир
не-ет, в плоскости - либо только подвыподверт, либо только перевыподверт. и то,
и другое сразу возможно только в пространстве! Прошу простить за долгое ...
qopt.phys.msu.su:8100/forum/topic.asp?TOPIC_ID=29&whichpage=2

Запрос:
[подв*подверт]

Результаты 1 - 1 из 1 для подв*подверт.

Единственный в выдаче:
(811) ПОБАГРОВ ЛЪ (3) ПОБАИВАЛСЯ (2) ПОБАЛОВАТЬ (1) ПОБ ГУ (1) ПОБ ...
ПОДВЕРТ ЛЪ (1) ПОДВЕРТКИ (1) ПОДВЕСЕЛИТЬ (1) ПОДВ НЕЧНОЕ (1) ПОДВ СКАМИ (1) ПОДВ
СКИ (3) ПОДВ СОКЪ (2) ПОДВИГАЛИСЬ (1) ПОДВИГАЛСЯ (1) ПОДВИГАМЪ (1) ...
www.karelia.ru/bin/concor?t=a&f=idiot/143/142 - 209k

Запрос:
[подвыподвер*]

Результат:
Результаты 1 - 2 из примерно 6 для подвыподвер*.

В выдаче два документа:
Pressball.by - sst
... 2173, Триумф, Никитин В.Л., Минск, 72. 2173, Удар с
подвыподвер-2, Сачивко А.В., Смолевичи, 72. ...
www.pressball.by/cgi-bin/sst.pl?cmd=total&id=2&page=23&code=li


Pressball.by - sst
... 738, Тигры, Азаров И.И., Минск, 46. 738, Удар с
подвыподвер-2, Сачивко А.В., Смолевичи, 46. ...
www.pressball.by/cgi-bin/sst.pl?cmd=tour&id=2&page=8&code=li


Может, Гугл пытается воспринимать эти запросы со звездочками как опечатки и сравнивает со словарем, а затем выдает такой результат, как если бы опечатку исправил?

Про количество слов в строке поиска

Добавил раздел про количество слов в строке поиска - перед разделом "Стемминг"

Забавное об операторе define:

Добавил материал о забавном поведении оператора define:

Службы Гугла добавлены

Добавил список служб Google по версии 3DNews.ru

Re: Службы Гугла добавлены

Добавил данные о дополнительных русскоязычных службах Гугла с ресурса "Ìèð Google"

Добавлена сводная таблица и статья разделена на две ча

1. Добавил таблицу, в которую сведены все основные операторы Гугла, приведенные в статье.

2. Сделал вторую часть статьи, куда вынес все службы Гугла, потому что на страницу просто перестал помещаться текст. Я сделал внизу гиперссылки со страницы на страницу. Но если кто-то может подсказать, как эти страницы можно связать более корректно, я бы так и сделал.

Добавлено о количестве слов в поисковой строке

Добавил фразу с гиперссылкой на источник:

"Согласно информации Сергея Кузнецова, приведенной по состоянию на начало сентября 2006 г., Гугл "имеет на основной форме поиска максимальную длину запроса всего 32 слова".

(Анонимно)

mir-google.com

Может стоит объеденить усилия?

Re: mir-google.com

Может быть. Напишите мне, пожалуйста, по электронной почте Ваши мысли и предложения на этот счет. Либо - по адресу в блоге, либо - по адресу на моем сайте http://ci-razvedka.narod.ru/

на счет синонимов


последующие 2 запроса дают разные результаты:
[site:ru linear algebra]
[site:ru linear ~algebra]

а так же Google Keyword Tool позволяет осуществлять поиск синонимов среди ключевых слов, можно опробовать здесь https://adwords.google.com/select/KeywordToolExternal
http://separser.ru тут добавь свои запросы, ТОП которых держишь и узнаешь инфу о конкурентах