EOMY.NET
Хостинг EOMY.NET: Форум поддержки
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
RSS Feed  

Ищется способ отбора страниц с PR
На страницу Пред.  1, 2
 
Начать новую тему   Ответить на тему    Список форумов EOMY.NET -> Раскрутка
Ищется способ отбора страниц с PR
Автор Сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Пн, 06 Окт, 2008 14:13    Заголовок сообщения: Ответить с цитатой

lazutov писал(а):
там нужно добавить массив с хостами чтобы не блокировали

А конкретнее на пальцах можно куда массив добавить?
У меня вроде 1500 тыс страниц прошли без блокирования Confused
_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Alek$
11 1110 1000
11 1110 1000


Зарегистрирован: 24.11.2007
Сообщения: 1136
Откуда: Новосибирск
26695 Монеты

СообщениеДобавлено: Пн, 06 Окт, 2008 14:43    Заголовок сообщения: Ответить с цитатой

lazutov
в смысле с разными датацентрами?
_________________
Самая страшная ошибка - это ошибка без видимых причин и конкретных последствий.
phpBB3 [db_update.php generator]
phpBB3 [Russian]
Антисоциальный блог
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Пн, 06 Окт, 2008 15:42    Заголовок сообщения: Ответить с цитатой

нет.
При работе через http://toolbarqueries.google.com/search?sourceid после оооочень большого количества появляется строка state:banned

Работайте через http://www.google.com/search?client=navclient&ch=6%u&features=Rank&q= при этом меняйте зону
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Alek$
11 1110 1000
11 1110 1000


Зарегистрирован: 24.11.2007
Сообщения: 1136
Откуда: Новосибирск
26695 Монеты

СообщениеДобавлено: Пн, 06 Окт, 2008 15:47    Заголовок сообщения: Ответить с цитатой

lazutov
что-то не катит...
Цитата:
Your client does not have permission to get URL /search?client=navclient&ch=6%u&features=Rank&q=site.com from this server. (Client IP address: 89.251.107.3)

Please see Google's Terms of Service posted at http://www.google.com/terms_of_service.html

If you believe that you have received this response in error, please report your problem. However, please make sure to take a look at our Terms of Service (http://www.google.com/terms_of_service.html). In your email, please send us the entire code displayed below. Please also send us any information you may know about how you are performing your Google searches-- for example, "I'm using the Opera browser on Linux to do searches from home. My Internet access is through a dial-up account I have with the FooCorp ISP." or "I'm using the Konqueror browser on Linux to search from my job at myFoo.com. My machine's IP address is 10.20.30.40, but all of myFoo's web traffic goes through some kind of proxy server whose IP address is 10.11.12.13." (If you don't know any information like this, that's OK. But this kind of information can help us track down problems, so please tell us what you can.)

_________________
Самая страшная ошибка - это ошибка без видимых причин и конкретных последствий.
phpBB3 [db_update.php generator]
phpBB3 [Russian]
Антисоциальный блог
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Пн, 06 Окт, 2008 16:04    Заголовок сообщения: Ответить с цитатой

чет Катит. там еще есть шифрование череззадчатое.
Код:
// Google PR
define('GOOGLE_MAGIC', 0xE6359A60); // эта особая, зашифрована магия.

function nooverflow($a)
  {
  while ($a<-2147483648)
     $a+=2147483648+2147483648;
  while ($a>2147483647)
     $a-=2147483648+2147483648;
  return $a;
  }

function zeroFill ($x, $bits)
  {
  if ($bits==0) return $x;
  if ($bits==32) return 0;
  $y = ($x & 0x7FFFFFFF) >> $bits;
  if (0x80000000 & $x)
     {
     $y |= (1<<(31-$bits));
     }
  return $y;
}

function mix($a,$b,$c)
  {
  $a=(int)$a; $b=(int)$b; $c=(int)$c;
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,13));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<8);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,13));
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,12));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<16);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,5));
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,3));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<10);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,15));

  return array($a,$b,$c);
  }

function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC) {
if(is_null($length)) {
$length = sizeof($url);
}
$a = $b = 0x9E3779B9;
$c = $init;
$k = 0;
$len = $length;
while($len >= 12) {
$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
$mix = mix($a,$b,$c);
$a = $mix[0]; $b = $mix[1]; $c = $mix[2];
$k += 12;
$len -= 12;
}

$c += $length;
switch($len)
{
case 11: $c+=($url[$k+10]<<24);
case 10: $c+=($url[$k+9]<<16);
case 9 : $c+=($url[$k+8]<<8);
case 8 : $b+=($url[$k+7]<<24);
case 7 : $b+=($url[$k+6]<<16);
case 6 : $b+=($url[$k+5]<<8);
case 5 : $b+=($url[$k+4]);
case 4 : $a+=($url[$k+3]<<24);
case 3 : $a+=($url[$k+2]<<16);
case 2 : $a+=($url[$k+1]<<8);
case 1 : $a+=($url[$k+0]);
/* case 0: nothing left to add */
}
$mix = mix($a,$b,$c);
/*-------------------------------------------- report the result */
return $mix[2];
}

function strord($string) {
for($i=0;$i<strlen($string);$i++) {
$result[$i] = ord($string{$i});
}
return $result;
}

function get_pr($url) {

$result=array("",-1);

if (($url.""!="")&&($url.""!="http://")):
if (substr(strtolower($url),0,7)!="http://"):
$url="http://".$url;
endif;

$url="info:".$url;
$checksum=GoogleCH(strord($url));
$google_url=sprintf("http://www.google.".google_rand()."/search?client=navclient&ch=6%u&features=Rank&q=".$url,$checksum);

$handle = @fopen($google_url, "rb");
$contents = '';
if ($handle) {
while (!@feof($handle)) {
 $contents.= @fread($handle, 8192);
}
fclose($handle);
$p=explode(":",$contents);
if (isset($p[2])):
$result=trim($p[2]);
endif;
} else {$result = 0;}
endif;

return($result!="" && (strlen($result)>0 && (strlen($result)<3))?$result:"0");
}

_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Вт, 07 Окт, 2008 02:48    Заголовок сообщения: Ответить с цитатой

Цитата:
При работе через http://toolbarqueries.google.com/search?sourceid после оооочень большого количества появляется строка state:banned

Ну для просмотра всех страниц одного сайта бана быть не должно, в крайнем случае можно поставить таймаут или по частям сканить страницы сайта. ИМХО, все таки этот скрипт для себя, а не для создания мега пупер сервиса.
_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Вт, 07 Окт, 2008 05:46    Заголовок сообщения: Ответить с цитатой

Веденин
я просто сказал, что грабли есть. Mywhois.name получал бан по 2-3 раза в неделю примерно с 200-300 запросами в сутки.
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Вт, 07 Окт, 2008 06:52    Заголовок сообщения: Ответить с цитатой

Цитата:
я просто сказал, что грабли есть. Mywhois.name получал бан по 2-3 раза в неделю примерно с 200-300 запросами в сутки.


Я понял, спасибо
Кстати, если менять ip'ник откуда идет запрос бана я так понимаю быть не должно, т.е. сделали 1000 запросов на локальном компе, переконектились к инету (естественно, если провайдер дает динамические адреса), и ещё 1000 запросов?
_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Alek$
11 1110 1000
11 1110 1000


Зарегистрирован: 24.11.2007
Сообщения: 1136
Откуда: Новосибирск
26695 Монеты

СообщениеДобавлено: Вт, 07 Окт, 2008 11:34    Заголовок сообщения: Ответить с цитатой

lazutov писал(а):
там еще есть шифрование череззадчатое.

Shocked Ох ни фига себе!.. Огромное спасибо.
_________________
Самая страшная ошибка - это ошибка без видимых причин и конкретных последствий.
phpBB3 [db_update.php generator]
phpBB3 [Russian]
Антисоциальный блог
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов EOMY.NET -> Раскрутка Часовой пояс: GMT
На страницу Пред.  1, 2
Страница 2 из 2

 


EOMY TOP 100 Rambler's Top100   Рейтинг@Mail.ru    



Powered by phpBB © 2001, 2005 phpBB Group


Рейтинг SIMPLETOP.NET