 Как сообщают СМИ, руководителем компании "Google" может стать Умид Курдистани. Это - выходец из Иранского Курдистана, специалист по интернет-технологиям, проживающий в США и хорошо изветный в курдской диаспоре.Google (произносится /ˈguːgl/, «гугл») — первая по популярности (77,05 %[2]) в мире поисковая система, обрабатывающая более 40 миллиардов запросов в месяц (доля рынка 62,4 %).
Поисковой системой Google владеет корпорация Google Inc.
Лидер поисковых машин интернета, Google занимает более 60 % мирового рынка и индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 186 языках (на 15 октября 2009).
Google поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.
История создания
Поисковая система Google была создана в качестве учебного проекта студентов Стендфорского университета Лари Пейджа и Сергея Брина. Они в 1995 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.
Индексация сайтов
Поисковый робот Google имеет User Agent — Googlebot, который является основным роботом сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
Googlebot-Mobile — робот индексирующий сайты для мобильных устройств,
Google Search Appliance (Google) gsa-crawler— поисковой робот нового аппаратно-программного комплекса Search Appliance,
Googlebot-Image — робот сканирующий страницы для индекса картинок,
Mediapartners-Google — робот сканирующий контент страницы для определения содержания AdSense,
Adsbot-Google — робот сканирующий контент для оценки качества целевых страниц AdWords.
Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.
Так же существует обратная теория называющаяся Бонус новичка в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий Page Rank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели.
Проблемы с авторскими правами
KaZaA и Церковь Сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом.Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.
New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права. Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования через файл robots.txt, который является механизмом, который позволяет операторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска, или через мета-теги, которые позволяют редактору контента указать, можно ли индексировать или архивировать документ, и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.
Алгоритм ранжирования
Мета-тег Keywords не учитывается при ранжировании сайтов.
PageRank
Основная статья: PageRank
Google использует алгоритм расчёта авторитетности страницы PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.
Поисковые запросы
Синтаксис запросов
Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» даст все статьи Википедии на всех языках, в заголовке которых встречается слово Google
Поиск в найденном
Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного вебсайта. Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel) «телепортирование» в сети — это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперёд, и вместо просто «телепортирования», что значит для поиска нужного сайта пользователю достаточно ввести часть имени вебсайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта.Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта.
Несмотря на то, что пользователям в новинку этот поисковый инструмент, он вызвал разногласия среди некоторых издательств и дистрибьюторов. На страницах результатов поиска Google отображаются платные (pay per click) рекламные объявления конкурирующих компаний, которые основывают рекламные объявления на брендах. «В то время как сервис мог бы помочь увеличить трафик, некоторые пользователи „сливаются“, так как Google использует известность брендов для продажи рекламных объявлений, как правило, конкурирующим компаниям».[Чтобы сгладить этот конфликт Google предложил отключать эту возможность для желающих компаний.
|