Страница 1 из 1

Парсер

Добавлено: 10 авг 2006, 12:17
vitpanov
Доброго всем времени суток! Люди помогите кто чем может. Как написать парсер(или еще его граббером зовут) для каталога ссылок. Короче он должен вынимать ссылки по descriptions, keywords из других каталогов в Сети и добавлять в свою базу. Раскажите, кто что знает. Пожалуйста.

Добавлено: 31 авг 2006, 09:20
Санек_5054
Я знаю об этом все :) .
Короче нужен код (html) откуда будем инфу драть! а без кода ничего сказать нельзя!!!

Добавлено: 31 авг 2006, 10:02
vitpanov
Здарова Санек! Ну наконец-то на форуме знатный человек появился! Ну объянсяй, url . . допустим http://catalog.yandex.ru/
Если неправильно указал покажи на своем примере.

Добавлено: 31 авг 2006, 11:00
Санек_5054
обьясни подробнее чего ты хочешь оттуда дернуть! чем подробнее обьяснишь тем лучше!
Надо просто выдрать название категорий и в базу забить ?
например :
Hi-Tech - компьютеры, интернет, мобильники
и так далее или например отсюда : http://catalog.yandex.ru/yca/cat/Computers/Hardware/ выдрать все посты. например первый пост :
"Hewlett Packard"
Каталог производимой HP компьютерной техники и периферии, сетевого оборудования, накопителей информации. Контакты. Сведения о компании.
http://www.hp.ru — Цитируемость: 13000.
"Hewlett Packard" - производитель принтеров
"Hewlett Packard" - производитель сканеров
Все подразделы 7

или выдрать обьявы по введенным словам ?