Показаны сообщения с ярлыком статьи. Показать все сообщения
Показаны сообщения с ярлыком статьи. Показать все сообщения

четверг, июля 05, 2007

Исследования контекстной рекламы в Рунете от Яндекса

Наткнулся на интересный документ - Исследование контекстной рекламы в Рунете на Яндексе. (Новость, Полный текст исследования).

Самое главное - пишут что рынок контекстной рекламы постоянно увеличивается, (в четверо за 2006 год), что неудивительно - и давно обогнал рынок баннерной рекламы. Хитро намекают, что якобы именно они придумали контекстную рекламу (В 2001 - появился Директ, а Гугл Адсенс и Бегун только в 2002). Незнаю так это или нет.

Интересно: 43 % всех кликов в Рунете проиходит в Москве. Там же и самая высокая средняя стоимость клика - в 2-2.5 раза больше. Получается что Москва приносит больше 70 % всех доходов! Сразу вспомнился анекдот, что за МКАД'ом в России жизни нет. Также, если верить документу - больше 50 % всего рынка принадлежит Яндексу - странно, вроде визуально сайтов с Директом не так много.

вторник, мая 29, 2007

Маскируем скрипт - прикидываемся браузером

В PHP есть супермощный класс CURL - который позволяет полностью эмулировать соединения с различными параметрами. С помощью небольшого тюнинга можно добиться, что наш скрипт будет неотличим от браузера управляемым человеком.

Зачем это нужно? Опыт показывает, что, например, поисковые системы - скрипту эмулирующему браузер перекрывают кислород намного позже.

Чем браузер отличается от скрипта? Он передаёт строку юзер-агента, сохраняет и отдаёт куки, передаёт сточку реферера (адрес страницы откуда пришли) - мы будем делать то же самое.

Простейший способ использования CURL:

$url = "http://www.site.com";
$ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$str = curl_exec($ch);

curl_close($ch);


Текст страницы оказывается в переменной $str - с ним потом можно делать всё что угодно.

Теперь тюнингуем наш простейший скрипт.

1. Добавляем сточку юзер-агента

$user_agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)";
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);


Строчку юзер-агента можно вставить любого популярного браузера. Это - для Microsoft Outlook 6.0. Также браузер часто передаёт версию ОС и некоторые параметры - например тут версию .NET.

2. Если вызываем несколько страниц на сайте, сохраняем и отдаём куки


$cookie_file = " ..тут вставляем путь к файлу ..";
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);


Многие сервисы "отсеивают" скрипты - устанавливая, а затем запрашивая переменную в куки. Путь к куки файлу должен быть полный. При запуске скрипта - желательно удалить файл куки, оставшийся от предыдущей работы скрипта. Также для файла сохраняющего куки, или для папки куда он сохраняется - должны стоять права на запись.

3. Передаём реферера.

Реферер - это адрес страницы, указывающий откуда пришёл пользователь, т.е. адрес страницы на которой была ссылка или форма, действие которой привело на текущую страницу.

curl_setopt($ch, CURLOPT_REFERER, "http://site.com");

Для чего это нужно? Некоторые сервисы могут его проверять и делать определённые выводы. Например, для парсинга страниц результатов поиска Google - можно установить реферер http://google.com - т.е. мы показываем наш эмулятор браузера - "пришёл" на страницу с результатами поиска с главной страницы.

4. Делаем небольшую паузу между запросами

Юзер не кликает страницы друг за другом, а просматривает их через определённое время, поэтому, в случае, если запрашиваем много страниц циклом - нужно обязательно вставить небольшую паузу.

sleep(5);

Также можно сделать случайную паузу, например от 2 до 10 секунд.

sleep( rand(2,10) );

5. Использование прокси

Чтобы совсем замаскировать следы - можно использовать прокси.

curl_setopt($ch, CURLOPT_PROXY, "111.222.333.444:5555");

Нужно удалять файл куки перед сменой прокси.


Инструкции для эмуляции браузера с использованием CURL получаются следующие:

$url = "http://www.site.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$user_agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)";
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);

$cookie_file = " ..тут вставляем путь к файлу ..";
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);

curl_setopt($ch, CURLOPT_REFERER, "http://site.com");
curl_setopt($ch, CURLOPT_PROXY, "111.222.333.444:5555"); //Прокси - если необходимо

$str = curl_exec($ch);
curl_close($ch);

...

sleep( rand(2,10) );

пятница, мая 18, 2007

Повышение эффективности. Работайте меньше - получайте больше

Мощный пост в блоге Димка: http://blog.dimok.ru/10-luchshih-sposobov-sokratit-svoyu-rabochuyu-nedelyu. Реальные советы как повысить свою эффективность. В последнее время прихожу к этим же выводам и стараюсь изменить свой распорядок именно так.

1. Урезать рабочие часы. Определите себе конкретное количество рабочего времени в день и в неделю и во что бы то ни стало укладывайтесь в него. Вы обнаружите, что стали работать гораздо более продуктивно, поскольку дела теперь нужно завершить быстрее..

2. Работайте дома. Всё больше людей находят способы работать из дома, либо выполняя свои обычные обязанности при помощи телекоммуникационных средств связи, либо находя новую работу, которая не требует присутствия в офисе. Сам по себе этот шаг не уменьшит ваше рабочее время, напротив, может закончится тем, что работать станете еще больше. Нужно скомбинировать его с первым советом – ограничить рабочие часы дома и решительно поставить себя в жёсткие рамки режима.

3. Выделите определенное время для RSS и электронной почты. Не позволяйте себе быть доступным всему миру в любое время дня. Установите конкретное время, когда вы проверяете почту и отвечаете на неё, читаете RSS-фиды, прослушиваете голосовую почту, и соблюдайте эти ограничения. Вам совершенно ни к чему находиться на связи постоянно.

4. Повышайте концентрацию. Если хотите работать меньше, выполняйте свои задачи качественнее. Это означает – оставьте в покое идею многозадачности и концентрируйтесь на чём-то одном. Устраните все отвлекающие факторы, наведите вокруг себя порядок и сфокусируетесь на том, чем в данный момент заняты.

5. Ставьте временные ограничения. Закон Паркинсона гласит, что выполнение задачи затянется на столько времени, сколько будет доступно. Поэтому всегда лимитируйте время на конкретную задачу. Парадоксально, но работает. Дайте себе 30 минут, чтобы сделать нечто. Или час. Если задача слишком масштабна, чтобы выполнить за час, разбейте её на подзадачи и распланируйте уже их.

6. Делайте только большие задачи с большим результатом. Самые важные – это те, что дают наиболее существенный результат, чем бы он в вашей работе не измерялся. Всё остальное – это просто суета. Сфокусируйтесь на самых ключевых делах, которые имеют наибольшую ценность.

7. Отдайте в аутсорс всё остальное. Если задача или проект не обещают принести значительной прибыли, вам не надо их делать. Пусть делает кто-то, кто нуждается в работе. Будьте беспощадны, когда дело касается вашего времени – вам совершенно ни к чему тратить миллионы часов на работу.

8. Сократите свои обязательства. Возможно, вы слишком много на себя берете. Если пересмотрите обязательства, сможете сократить свою рабочую загруженность и количество времени, которого она требует.

9. Выключайте компьютер. Он – самый большой отвлекатель внимания из когда-либо изобретенных. Не позволяйте себе сидеть за компьютером постоянно – иначе никогда ничего не сможете закончить.

Бонусный совет: найдите способы получать пассивный доход. Это деньги, за которые не надо слишком много работать. Инвестиции, самодостаточный веб-сайт, бизнес, не требующий активного менеджмента с вашей стороны… это лишь несколько идей пассивной прибыли. Это потребует одноразового вложения капитала или времени, но, сделав один раз, вы будете получат стабильные деньги без необходимости для этого работать.
Оригинал тут: http://zenhabits.net/2007/04/top-10-ways-to-reduce-your-work-week/

Приходишь к этому не сразу - но вывод сначала обескураживает. Чтобы получать больше - нужно меньше работать. Работать нужно гораздо эффективней. Это как раз и становиться возможным, если уменьшить кол-во рабочих часов. А дальнейшее увеличение времени ничего не даст - только усталось, ухудшение производительности и топтание на месте. Это как закон бизнеса про 20 и 80 % - что 20 % бизнеса даёт 80 % прибыли и наоборот, в личной работе можно откинуть эти 80 % и заняться остальными 20 %.

P.s Блоггер научился сохранять черновики автоматически в процессе написания поста. Круто.

пятница, декабря 01, 2006

Море волнуется раз..

Две статьи про новый алгоритм Google, на searchengines.ru.

"Можно утверждать, что Google с помощью новостной службы Google News и недавно запущенного поиска по блогам Google Blog Search научился анализировать информационную картину и разделять информационные потоки, которые попадают в его индекс.

На практике это уже обернулось тем, что по англоязычным запросам, связанными с наиболее важными мировыми событиями, поисковая выдача неоднородна и состоит из наложений сайтов из основного индекса, новостей из Google News и постов из Google BlogSearch. Очевидно, что количество выведенных таким образом сайтов определяется исходя из важности события в мировых масштабах - для top-тем поисковая выдача."

"Самое поразительное, что такая выдача находится в постоянном развитии (как и новости, которые непрерывно поступают по важнейшим событиям), поэтому по одному и тому же запросу уже спустя несколько часов можно получить совершенно другие результаты."

Особое мнение - новый социальный алгоритм ранжирования Google
http://www.searchengines.ru/articles/005321.htm

Новый социальный алгоритм ранжирования Google - часть 2
http://www.searchengines.ru/articles/005322.html

вторник, октября 31, 2006

Оставайтесь голодными. Оставайтесь безрассудными.

Русский перевод речи Стива Джобса перед выпускниками Стэнфордского университета. Впечатлило. По сути, рассказывает про сильные решения, которые поменяли его жизнь.

http://www.sellme.ru/2005/06/16/stiv_djobs_i_tri_ego_istorii