EOMY.NET
Хостинг EOMY.NET: Форум поддержки
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
RSS Feed  

Бесплатный скрипт для подбора каталогов

 
Начать новую тему   Ответить на тему    Список форумов EOMY.NET -> Скрипты
Бесплатный скрипт для подбора каталогов
Автор Сообщение
zos
Хостинг — это наше всё!
Хостинг — это наше всё!


Зарегистрирован: 18.05.2007
Сообщения: 287

956 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 12:43    Заголовок сообщения: Бесплатный скрипт для подбора каталогов Ответить с цитатой

Скрипт для создания баз каталогов.

Столкнулся с такой проблемой, когда мне нужно было как-то собрать базу каталог, так как не нашёл нормальную программу для этого, одна с вирусом оказалось и т. д. Попробовал сам написать. Думаю, что основным системным требованием является процессорное время на выполнения скрипта, порой когда у хостера стоит nginx может вылетать 502 ошибка (но, не всегда), но всё нормально парсится.

У меня скрипт нормально работает при

core file size (blocks, -c) 0
data seg size (kbytes, -d) 32768
file size (blocks, -f) unlimited
max locked memory (kbytes, -l) 8192
max memory size (kbytes, -m) 32768
open files (-n) 24
pipe size (512 bytes, -p) 1
stack size (kbytes, -s) 8192
cpu time (seconds, -t) 20
max user processes (-u) 16
virtual memory (kbytes, -v) 32768

Подробнее
http://ocherk.com/index.php/2009/01/06/besplatnyj-skript-dlya-podbora-katalogov/#more-181
Сам скрипт
http://ocherk.com/wp-content/uploads/2009/01/gps.zip
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 13:29    Заголовок сообщения: Ответить с цитатой

может это и у меня проблемы, но таймаут.
// открылся.
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 14:01    Заголовок сообщения: Ответить с цитатой

на будущее: заверните всё в функции(в том числе парсинг гугла) для:
1) удобного вызова
2) в будущем пригодится
и зачем инклудить 2 файла, если в них по 1 функции? Соберите все в 1.
Сам оцените удобство.
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 19:51    Заголовок сообщения: Ответить с цитатой

lazutov писал(а):
на будущее: заверните всё в функции(в том числе парсинг гугла) для:
1) удобного вызова
2) в будущем пригодится
и зачем инклудить 2 файла, если в них по 1 функции? Соберите все в 1.
Сам оцените удобство.

Да, конечно лучше использовать функции и не инклюдить почти пустые файлы, плюс несколько замечаний:
1) Вместо get_content можно использовать стандартную функцию file_get_contents (например так: $str = file_get_contents($url), функция скопирует все содержимое страницы в строку - переменную, при этом ни для google, ни для yandex никакой разницы между этими двумя функциями нет.
2) Вместо функции win_utf8 можно использовать стандартную функцию urlencode
3) Имхо лучше результаты или записывать в БД или выводить на экран, но если хотите писать в файл дайте возможность менять его имя в настройках + уберите переменную $button из настроек, так как она нигде не используется + добавьте настройки времени ожидания между каждым запросом к гуглу и настройки кол-ва страниц которые надо парсить.

Посмотрите здесь как у меня реализован парсинг результатов с гугла, яндекса и яндекс xml
_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 19:58    Заголовок сообщения: Ответить с цитатой

Цитата:
2) Вместо функции win_utf8 можно использовать стандартную функцию urlencode

Низя.
Все правильно.
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Вт, 06 Янв, 2009 20:13    Заголовок сообщения: Ответить с цитатой

lazutov писал(а):
Цитата:
2) Вместо функции win_utf8 можно использовать стандартную функцию urlencode

Низя.
Все правильно.

Что я делаю не так? Confused
http://174.36.212.210/i.php

Код:
<meta http-equiv="Content-Type" content="text/html;charset=windows-1251">
<form action="">
<input type="text" name="q" value='<?php echo $_GET['q']; ?>' >
<input type="submit" value="Сформировать ссылку">
</form>
<?php echo '<a href="http://www.google.ru/search?as_q='.urlencode($_GET['q']).'&hl=ru&newwindow=1&num=100&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images">'.$_GET['q'].'</a>';
?>


или по простому

Код:
$str = 'добавить ссылку';
echo '<a href="http://www.google.ru/search?as_q='.urlencode($str).'&hl=ru&newwindow=1&num=100&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images">'.$str.'</a>';

_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
lazutov
while (1==1);
Последний герой


Зарегистрирован: 30.04.2007
Сообщения: 3840

111220 Монеты

СообщениеДобавлено: Ср, 07 Янв, 2009 07:59    Заголовок сообщения: Ответить с цитатой

Человек ее использует для сохранения в txt
_________________
сервис DNS | разные http, DNS и прочие утилиты
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Веденин
Красные глаза
Красные глаза


Зарегистрирован: 17.05.2007
Сообщения: 2066
Откуда: Самара
11733 Монеты

СообщениеДобавлено: Ср, 07 Янв, 2009 19:59    Заголовок сообщения: Ответить с цитатой

lazutov писал(а):
Человек ее использует для сохранения в txt

Мы с Вами смотрели разные исходники? Я нашел только одно использование этой функции
Код:

  $path = "/search?num=100&hl=ru&newwindow=1&q=".win_utf8($query)."&start=$k&sa=N";
  $contents = get_content($hostname, $path);

Здесь явно идет запрос к гуглу, а не сохранение в файл.

P.S. Да кстати для серьезного скрипта поиска каталогов желательно добавить парсинг и яндекса (так в основном прогоняют по каталогам для поднятия тица) + определение тица и pr сайта (в идеале определение кол-ва проиндексируемых страниц в каждом поисковике) и фильтрация с очень маленьким тиц или pr (см. скрипты тамже) + в идеале поиск страницы, где находится форма добавления в каталог сайта (например, перебором всех страниц сайта на которые есть ссылка с главной страницы <или странице на которую указывает поиковик> сайта до тех пор пока не будет найдена страница с подстрокой <form ).
_________________
Написание конвекторов, парсеров, интеграции нескольких сайтов (в личку)

Тематические поисковые системы Рунета: Танцевальная, программиста, поиск книг
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов EOMY.NET -> Скрипты Часовой пояс: GMT
Страница 1 из 1

 


EOMY TOP 100 Rambler's Top100   Рейтинг@Mail.ru    



Powered by phpBB © 2001, 2005 phpBB Group


Рейтинг SIMPLETOP.NET