Показаны сообщения с ярлыком google. Показать все сообщения
Показаны сообщения с ярлыком google. Показать все сообщения

суббота, июля 07, 2007

Google Adsense - Ориентация на разделы

В последнее время начал эксперементировать с Google Adsense - и оказалось что есть вещь аналогичная тегам у бегуна - возможность выделения части контента для указания более релевантной части текста на странице. Как ни странно, это не очень афишируется и есть определенные ограничения, по-видимому связанные с тем, что эти возможности могут широко использовать спамеры.

Подробно: https://www.google.com/adsense/support/bin/answer.py?answer=23168&ctx=ru:search&query=AdSense+Section+Targeting&topic=&type=f

Примеры использования:
HTML-теги, предназначенные для подчеркивания важности раздела страницы, имеют следующий формат:
<!-- google_ad_section_start -->

<!-- google_ad_section_end -->

Добавив в начальный тег выражение (weight=ignore), можно указать те разделы, которые Вы хотели бы проигнорировать.
<!-- google_ad_section_start(weight=ignore) -->

Там же предупреждают - что таким образом нельзя выделить, например, заголовок раздела - и нужно включать только большие объёмы контента. Малые объёмы заключённые в такие теги могут быть расценены как нарушение программы. Нужно будет попробовать, по крайней мере будет полезно исключать некоторые блоки которые могут уменьшать релевантность (например комментарии).

Хорошо расписано в Блогера из Алтая тут: http://bobrdobr.blogspot.com/2007/07/google-adsense-section-targeting.html

среда, июля 04, 2007

вторник, мая 29, 2007

Как Обхитрить Гугл

Я вчера писал, что у меня возникли проблемы с использованием сервиса Google Translate. Я просто стал слишком много его использовать, ему это не понравилось. Как быть? Проект должен работать, проблему нужно решать быстро.

Решений такой проблемы может несколько. Самое первое, что приходит на ум - это использовать прокси. Но для этого нужно писать сборщик прокси, который ещё будет их ещё чекать (хоть такой скрипт у меня уже давно есть). Я решил сделать проще. Для этого воспользуемся знаниями о том, как устроен гугл. Гугл - это множество датацентров в разных частях света, в зависимости от того, где мы находимся, гугл эффективно манипулирует DNS - и мы получаем доступ к ближайшему или быстрейшему. Датацентры - это система в себе, которая содержит полностью поисковый кэш и все сервисы гугла.

Нам ничего не мешает обращаться к разным датацентрам. Для этого возьмём список датацентов, в каком-нибудь сервисе, которые показывают pr на разных датацентрах. (Например: http://digpagerank.com/). Вместо обращения к google.com - будем обращаться к случайному ip датацентра.

Получается вот такая PHP функция:

function RusEnTranslate($text) {

$text = iconv("windows-1251", "UTF-8", $text);

$ips = array("59.151.21.100", "64.233.161.18", "64.233.161.81", "64.233.161.84");
shuffle( $ips );

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://".$ips[0]."/translate_t");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, 'hl=en&ie=UTF8&amp;langpair=ru|en&text='.$text.'&submit=Translate');
$str = curl_exec($ch);
curl_close($ch);

preg_match('/<div id="result_box" dir="ltr">([^<]*)<\/div>/isU', $str, $matches); return $matches[0]; } //func

Массив $ips - может содержать любое количество ip адресов датацентров. Аналогичный механизм можно использовать для парсинга поисковых результатов гугла.

Следующий пост напишу о том, как скрипту прикинуться пользователем и максимально эмулировать действия браузера управляемого человеком.

понедельник, мая 28, 2007

Google Translate стал блокировать своё частое использование

Сервис Google Translate стал, по-видимому, слишком популярен. Теперь при большом количестве запросов с одного ip, есть риск получить страницу "302 moved", и блокировку ip на определённый срок.

Блокировка появилась на днях, я два дня назад переводил позиции на английский с русского, скрипт успешно сделал 5000 запросов для перевода, сегодня сделать подобное уже не получилось =)

Лично я жду, когда гугл предложит использование Google Translate за деньги, например включит в Google Apps - чтобы можно было переводить без особых проблем, и использовать его автоматически в своих проектах.

пятница, мая 11, 2007

Новый Google Analytics

Вот стал доступен новый интерфейс Google Analytics. Теперь сделано очень грамотно и удобно, а не через жопу, как раньше. Видно учли все пожелания от пользователей. Всё интуитивно понятно и просто и находиться там где нужно. Особенно порадовала вкладка "Источники трафика", в старом интерфейсы эти данные были достаточно сложно представлены для восприятия. Большинство данных можно представить в виде графиков и диаграмм (причём, нескольких типов) и сохранить в виде отчётов



Появились новые хитрые параметры, например "Лояльность пользователей", "Скорость подключения пользователей" (Интересно, что такое Лояльность?). Теперь Google Analytics стал действительно необходимой вещью, и по видимому, особенно с сочетании Google Adwords - статистика позволяет отследить буквально каждый вздох юзера, пришедшего по рекламе.

Тур по новым возможностям Google Analytics тут:
http://services.google.com/analytics/tour/index_ru-RU.html

четверг, мая 10, 2007

Реикарнация

Вы не поверите, но после долгого перерыва, я решил вернуть этот блог к жизни и писать в нём дальше. О причинах столь странного поступка, мне самому точно известно, возможно из-за того, что вести блог полезно для поддержания собственной самодисциплинированности, с которой у меня небольшие проблемы.

Сразу новость.

Google Analytics через некоторое время предъявит новый интерфейс, остаётся надеяться, что он станет лучше. На данный момент, я считаю счётчик от liveinternet полезней, чем Google Analytics

среда, декабря 13, 2006

Гугл напугал криком



Опять про гугл. Сегодня появилось пару тем на умакс форуме - удивления народа насчёт странной картинки на Гугле. Некоторые даже подумали, что гугл поломали. =)

Пора бы уж и знать про "Крик". Такую картину увидишь - не забудешь.

Google news. По русски


Google по настоящему взялся за русификацию. Теперь русская версия Google News news.google.com - новости из нескольких сотен источников, которые автоматически сортируются по темам, и постепенно подстраиваются под каждого конкретного юзера - тем кто смотрит спортивные новости, будут чаще показыватся именно новости спорта, и т.д. Рулез, оч. удобно пользоваться.

среда, декабря 06, 2006

Официальный запуск Google Adwords в России

Сегодня на пресс-конференции в Москве компания Google объявила об официальном запуске системы поисковой рекламы Google AdWords в России. Следуя стратегии локализации своих сервисов для России и стремясь создать рекламодателям наиболее выгодные условия, Google предлагает возможность оплаты контекстной рекламы Google AdWords банковским переводом, самой распространенной формой платежа в России.

http://www.habrahabr.ru/article/1812/

Вообще новость очень хорошая - в перспективе будет больше рекламодателей, больше рекламы, и соотвественно будет хорошая отдача от рекламы Adsense установленной на русских сайтах. Т.к. сейчас отдача - кот наплакал. Объявления на русском языке - максимум 10 % от общего числа. У меня на одном тематическом проекте (больше 500 посетителей в сутки) Adsense за полгода принёс чуть меньше 100 $ - стоит только потому, что проект экспериментальный, и чтобы набрать минимальную сумму для платежа - 100 баксов. Потом уберём.

Ещё меня удивляет политика в отношении электронных платёжных систем со стороны гугла, на западе всё по другому - но у нас (бывший СССР) - е-деньги гораздо популярней. Я, например, вообще не представляю, что нужно делать, чтобы забросить на счёт 10 $ банковским переводом, в нашей богом забытой и отсталой Беларуси, наверное нужное полдня потратить и заплатить комиссий в 2 раза больше - а так бы попробовал раскрутить один из сайтов прямо сейчас (просто сходить в банк не предлагать =).

Google translate теперь и на русском

В сервисе перевода google.com/translate - добавился русский язык. Причём, переводит с английского на русский очень неплохо. Можно переводить отдельный текст, так и целую страницу.

воскресенье, декабря 03, 2006

PR10 сайты

Свежий и небольшой список сайтов с PR10 - их на самом деле совсем не много: http://www.seocompany.ca/pagerank/page-rank-10-sites.php

пятница, декабря 01, 2006

Море волнуется раз..

Две статьи про новый алгоритм Google, на searchengines.ru.

"Можно утверждать, что Google с помощью новостной службы Google News и недавно запущенного поиска по блогам Google Blog Search научился анализировать информационную картину и разделять информационные потоки, которые попадают в его индекс.

На практике это уже обернулось тем, что по англоязычным запросам, связанными с наиболее важными мировыми событиями, поисковая выдача неоднородна и состоит из наложений сайтов из основного индекса, новостей из Google News и постов из Google BlogSearch. Очевидно, что количество выведенных таким образом сайтов определяется исходя из важности события в мировых масштабах - для top-тем поисковая выдача."

"Самое поразительное, что такая выдача находится в постоянном развитии (как и новости, которые непрерывно поступают по важнейшим событиям), поэтому по одному и тому же запросу уже спустя несколько часов можно получить совершенно другие результаты."

Особое мнение - новый социальный алгоритм ранжирования Google
http://www.searchengines.ru/articles/005321.htm

Новый социальный алгоритм ранжирования Google - часть 2
http://www.searchengines.ru/articles/005322.html

понедельник, ноября 27, 2006

воскресенье, ноября 26, 2006

Модернизация блога

Google всё таки замучал напоминаниями, и настойчиво заставил переехать на Blogspot.Beta - новую версию блогов, что я и сделал, заодно заставим указать свой ящик в Gmail - теперь Гуглу известно, кто я на самом деле (оглядываясь по сторонам).

Ярлыки (тэги) - оказались ужасно удобной вещью, теперь постепенно прописываю для всех превыдущих сообщений. Редактирование шаблона - пятиминутное дело, быстро добавил и настроил отображение поиска по самым популярным ярлыкам (тегам).

среда, ноября 15, 2006

Google Earth углубилась в историю

"Благодаря сотрудничеству с известным коллекционером старинных карт Дэвидом Рэмси виртуальный глобус Google Earth теперь позволяет увидеть планету глазами наших предков. Добавленные в сервис карты дают возможность проследить, как изменялась Земля на протяжении трехсот лет, и как ее представляли картографы прошлого.

В Google Earth появилось 16 старинных карт различных территорий земного шара, включая Глобус Кассини 1790 года, карту Африки 1787 года и китайско-японскую карту Азии, датированную 1710 годом. Самая старая карта в коллекции относится к 1680 году."

http://lenta.ru/news/2006/11/14/gearth/

Во, специально скачал Google.Earth - чтобы посмотреть, до этого в глаза эту программу не видел (пользовался только Google Map).



Симпатично =) Пользоваться на порядок удобнее чем веб-сервисом maps.google.com.



Особенно здорово, когда постепенно наезжаешь на местность из космоса, и видны всё новые и новые детали. Теперь понятно как сделали заставку в сериале "Не родись красивой", когда появляется Москва. Содрали! (Сам сериал почти не смотрю, его смотрит жена с тёщей, особенно фанатеет тёща =)))

вторник, ноября 14, 2006

Новая версия Blogger

Blogger настойчиво предлагает перейти на новую версию, новые блоги теперь регистрируются только в новой версии. Посмотрел, понравилось, но пока переходить не буду. Изменения в принципе минимальные, но полезные.

Например, можно удобно и быстро поменять цвета любого элемента из шаблона, а сообщения раскидывать по вложенным папкам (категориям).

вторник, октября 31, 2006

Про гугл

Две занимательных статьи:

"Из источников внутри Google стало известно содержание двух внутренних документов, которые распространялись среди сотрудников компании ранее в этом году.

В список приоритетов входит устранение поискового спама в выдаче на 20-ти самых популярных языках. Судя по всему, в этот список должен входить и русский язык. Запланированы и другие меры по улучшению релевантности поисковой выдачи, а также изучение предпочтений пользователей и совершенствование интерфейса поисковой системы.

Чтобы закрепить свою позицию мирового лидера на рынке поиска информации, компания Google планирует основать крупнейшую в мире лабораторию по изучению искусственного интеллекта."

http://www.habrahabr.ru/article/1329/

"Мы верим в Google. Эта фраза должна быть напечатана на всех долларовых банкнотах. Мы – нация, озабоченная вопросами неприкосновенности частной жизни – с лёгкостью раскрываем наши самые сокровенные тайны всему миру.

А что, если я скажу Вам, что знаю все сайты, которые Вы посещаете, читаю все письма, которые Вы когда-либо написали или получили, каждое сообщение в мессенджере, которое Вы когда-либо послали, и содержание каждого звонка, который Вы сделали? Я знаю, сколько Вы платите за квартиру, сколько денег на Вашем счету. Я даже знаю, что Вы коллекционируете скульптурки гномиков. Вы наверняка будете вне себя от злости.

А что, если я скажу, что уже существует система, которая собирает всю эту информацию, делает это уже не первый год – и не связана ни с одним правительством? Да, она существует, называется Google – огромный информационный «чёрный ящик»."

http://www.habrahabr.ru/translation/1319/

четверг, октября 26, 2006

Остепенитесь, Товарищи!

Чуть устаревшая новость, но всё же. Серёга Брин призвал остановиться своих веб-разработчиков, в штамповании новых сервисов.

"Совладелец компании с иронией отметил, что сотрудники Google навыпускали уже столько программ, что пользователю сначала нужно запустить поиск, чтобы найти необходимый ему инструмент. Сервисов очень много, но большинство из них труднодоступны.

Вместо выпуска новых продуктов, сказал Сергей Брин, теперь нужно сосредоточится на интеграции существующих программ в удобные пакеты и сервисы."

Это правильно, пусть лучше сделают поиск в Google Reader, и объединят его с GMail.

http://www.habrahabr.ru/article/1209/


А это в дополнение к моему обзору Firefox и IE7:

Однако, независимые тесты на совместимость различных браузеров со стандартами W3C показали, что IE7 не сильно отличается от IE6, а оба они сильно уступают Firefox и Opera во всем, что касается совместимости с CSS, XHTML, DOM. В частности, общий уровень совместимости с CSS 2.1 в седьмой версии браузера вырос с 51% до 55%, тогда как Firefox и Opera имеют уровни совместимости 93% и 96%, соответственно.

http://www.habrahabr.ru/article/1238/

пятница, октября 20, 2006

Новые операторы Google

В полку операторов Google прибыло - и есть очень и очень полезные:

  • alllinks:example.com - shows all (absolutely all) links pointing to a certain domain, ordered by the PageRank of the referring site
  • invalid:example.com - shows pages of a certain domain not validating per W3C guidelines
  • invalidstrict:example.com - a validator as above, but it additionally shows everything that’s not conforming to the newest W3C recommendations
  • images:example.com - I know I can click on Google Image search and then use the site operator, but why not create a shortcut?
  • inlink:foo - returns only pages that use “foo” as the link text
  • inheader:foo - returns only pages that use “foo” in some headline (h1, h2 and so on)
  • inalt:foo - returns only pages including images with a certain alt-text
  • hot:example.com - shows pages of a domain which gained the most backlinks from other sites during the last 7 days
  • new:example.com - shows the pages which recently changed on a specific site
  • whois:example.com - returns domain information on Example.com
  • pagerank:example.com - orders all pages of a certain domain by PageRank (highest PR first), and displays the green bar icon next to titles in the SERPs
  • adult:example.com - returns only pages (of a specific site) which didn’t pass Google’s SafeSearch filter
(Дополнение от 26.10.2006) Новость оказалась фейком, или операторы ещё не работают. Источник тут: http://bloggreenwood.com/comments/4481_0_1_39_C/