June 29th, 2005

Ющук Евгений Леонидович

Если Яндекс воспринимает разные слова как словоформы одного слова

http://forum.yandex.ru/yandex/questions.xhtml?message_id=1284438#m1284438

Маргарита [27.06.05 18:34]
Совсем разные слова, как формы одного слова?

Посмотрите запрос по слову "тесто". Все 10 первых позиций заняты разного рода "тестами". Или, например, набираю "что почитать" - кроме 2х позиций вся первая страница занята словом "почти". Может все-таки отделить "тест" от "теста":-) А то некузяво как-то получается...
Ответить
Денис [28.06.05 12:03]
Re: Совсем разные слова, как формы одного слова?

Насколько понимаю, "тест" - это действительно одна из форм слова "тесто" (мн. ч., род. п.). Т.е. формально эта подстановка оправданна. Другое дело
Collapse )
Ющук Евгений Леонидович

Поисковые машины | Алгоритм Яндекса как результат исследования "черного ящика" | Этапы "поиска" и ра

http://www.minich.ru/business/seo/index.htm

Поисковые машины | Алгоритм Яндекса как результат исследования "черного ящика" | Этапы "поиска" и ранжирования документов

12 апреля 2005 года. 23 часа. Во-первых, с Днем Космонавтики!
Это достижение уже никто не отнимет у НАШЕГО СОВЕТСКОГО НАРОДА! Запуск первого в мире Спутника я помню довольно отчетливо, хотя мне было 5 лет. Всеобщее возбуждение и радость, толпы людей у нас во дворе ночью, пытающихся разглядеть движущуюся точечку на небе. Мне даже папа пытался показать ее на огромном небе (а ночи были ясные), но я ее никак не мог разглядеть и было страшно обидно.
Дома было
Collapse )

Тел. дом. (096-51)-565-30
Козлов Игорь Минович

 

Collapse )

 

Ющук Евгений Леонидович

Феномены интернета: невидимая Сеть

http://news.sjs.ru/news/5466/index.html

Невидимая Сеть (invisible Web) — коллекция доступных для поиска веб-сайтов, чье содержание содержится в базах данных и не включено в индекс традиционных поисковиков.

У всех поисковиков «общего пользования» имеется одна общая проблема, и большинство людей о ней даже не знает. А проблема формулируется предельно просто: огромная часть интернета для поисковиков абсолютно невидима.

Невидимая Сеть состоит из различных баз данных. Эта исключительно ценная информация, к сожалению, недоступна для индексирования программами обычных поисковиков, таких как «Яндекс», Google, Yahoo! и т.д. Другими словами, мы пока не можем получить доступ к этой информации стандартными средствами, которыми пользуемся каждый день.

Пауки поисковых машин обходят весь интернет и индексируют информацию. Когда они встречают такую базу данных, это похоже на несчастный случай — как будто вы врезались в массивную и плотно закрытую дверь библиотеки. В результате поисковик может назвать адрес этой библиотеки, но никогда не скажет, какие книги, журналы и другие документы там хранятся. Типичный пример — информационно-поисковая система по российскому законодательству. Тысячи документов из базы данных становятся доступны только после входа в систему, а пауки «Яндекса» не могут проникнуть в защищенную часть сайта.

К счастью, в интернете есть сайты-путеводители по ресурсам, составляющим невидимую Сеть, а также специализированные программы. Вот некоторые из них:
Infomine Multiple Database Search (академический инструмент поиска по университетским архивам, библиотекам и книгам), BUBL LINK (каталог информационных сайтов, которые уникальны в своей областях), Scirus (поиск научной информации на специализированных сайтах), Amazon.com (полнотекстовый поиск по содержанию всех книг).

В статье, посвященной «невидимой Сети», газета New York Times тоже приводит несколько примеров. Например, лучшим ресурсом по американскому законодательству назван сайт FindLaw.com, лучший сайт для сравнения цен — MySimon.com, наиболее полная финансовая информация — FinancialFind.com, а информацию из научно-популярных журналов и научных баз данных о биотехнологиях можно найти на Biolinks.com. Все эти сайты являются «порталами» для входа в невидимую Сеть, которая практически полностью отсутствует на Google.

Текст новостей тоже традиционно относился к невидимой Сети, но в последние годы все крупнейшие поисковые сайты разработали эффективные инструменты поиска новостей с ежеминутным обновлением: это, например, «Яндекс.Новости» и Google News.

Преимущество «невидимых ресурсов» — в их узкой специализации. Это такие же поисковые машины, но они настолько узко специализируются в своей отрасли, что позволяет авторам проекта вручную писать программы для доступа к отдельным базам данных или опять же вручную добавлять информацию в индекс. Поисковые машины невидимой Сети — это штучные автомобили ручной сборки по сравнению с массовыми моделями популярных поисковиков.

Collapse )

 

Ющук Евгений Леонидович

Где узнать о поисковых машинах англоязычного Интернета

Автор ряда публикаций о ресурсах Интернета Белинда Вивер (belinda@journoz.com) рассказывает о наиболее, по ее мнению, интересных веб-сайтах, содержащих информацию о поисковых машинах (scip.online, issue 33).

Некоторые из них созданы известным экспертом по Интернету Гарри Прайсом. Ему принадлежат веб-сайты:

* DirectSearch (www.freepint.com/gary/direct.htm ), врата в "невидимый" Интернет.
* List of Lists (www.specialissues.com/lol ), предлагающий блестящий список поисковых машин с их классификацией.
* the Resource Shelf (http://www.resourceshelf.com/), веб-сайт для профессионалов, информирующий о новых системах поиска в Интернете. Можно подписаться на еженедельный бюллетень новостей, но легче самому следить за новой информацией на сайте, обращая внимание на интересующие вас линки.

Также полезными могут быть ежемесячный бюллетень по интернет-ресурсам (www.hw.ac.uk/libWWW/irn/ ), выходящий дважды в неделю FreePint (www.freepint.com ), или еженедельник Scout Report (http://scout.cs.wisc.edu/

Ключевым сайтом автор считает Search Engine Watch (www.searchenginewatch.com/ ). Сайт предлагает сравнительный анализ различных поисковых систем. Здесь также можно подписаться на ежедневный вестник SearchDay (www.searchenginewatch.com/searchday ).

Хорошим источником новостей и информации являются Search Engine Showdown (www.notess.com ) и ResearchBuzz (www.researchbuzz.com ) .

Те, кто интересуются технологическими аспектами, могут найти много интересного на сайтах CNet (www.cnet.com )

Даже печать уделяет все больше внимания этим вопросам. К примеру, газета Boston Globe опубликовала интервью с генеральным директором Google Эриком Шмидтом. Как следует из его высказываний, компания Google стремится индексировать не только Интернет ресурсы, но и включить в спектр поиска крупнейшие платные коллекции и базы данных, такие как LexisNexis.

Отдельные профессионалы хотели бы иметь поисковые механизмы, встроенные в персональные компьютеры. Им было бы нелишне заглянуть на сайты AgentLand (www.agentland.com ) и BotSpot (www.botspot.com).
Здесь можно выгрузить программное обеспечение, которое доводится под требования пользователя. Но, конечно, большинству не под силу это сделать самостоятельно.

Б. Вивер также рекомендует почаще просматривать специализированные директории, которые не требуют поиска по всему Интернету, часто вслепую по ключевым словам, а предлагают систематизированный материал по конкретной теме. В частности весьма полезным может оказаться Pinakes (www.hw.ac.uk/libWWW/irn/pinakes/pinakes.html ). Он содержит 40 тематических разделов по различным областям знаний - социология, биотехнология и т.д.

Автор подчеркивает, что особенно важно следить за новыми системами , которые позволяют приоткрыть окно в т.н. "невидимый" Интернет. Именно там, а не в индексируемых ресурсах, находится наиболее ценная, интересная информация. Ведь базы данных поисковых машин охватывают не более 20% всех ресурсов Интернета.


Collapse )

 

Ющук Евгений Леонидович

WWW.RU Россия в Интернете

http://www.ru/rus/index.html

(синтаксис запросов - здесь:
http://www.ru/rus/qsyn.html)

Сервер, появившийся одним из первых в России (был создан в сентябре 1995 г.). Имеет самый простой и запоминающийся адрес. Очень часто на него попадают иностранцы в поисках любой информации о России.

По данным Комкон-2, www.RU занимает 8-ое место среди всех Интернет-ресурсов, используемых россиянами, 4-ое среди российских поисковых серверов и каталогов.

Этот сервер - наиболее цитируемый ресурс в российском Интернете: http://www.yandex.ru/top20ci.html

Аудитория

22,4% или 430 тыс. пользователей Интернет в России посещают сервер www.RU ( http://www.comcon-2.com/ Веб-вектор, 2 квартал 2000 г.)

При этом не учитываются иностранные посетители, которые составляют для данного сервера существенный процент от общего количества посетителей.

Collapse )

 

Ющук Евгений Леонидович

Ассортимент черных политтехнологов

http://kurilka.citforum.ru/data/pnp/black_pr.html

Ассортимент черных политтехнологов

(c) Александр Сергеевич Ольшевский, @Astera

Применяемые "черными пиарщиками" методики делятся на семь уровней по своей сложности. Низший из них предусматривает прямое манипулирование обывателем, побуждающее его изменить отношение к данному политику, а высший - скрытое манипулирование самим объектом, вынуждающее его предпринимать шаги, негативно влияющие на его имидж.

Чаще всего приходится сталкиваться
Collapse )