Где же истина при парсинге? Вопрос от MBH
Не могу понять куда деваются результаты.
-inurl:"html" -inurl:"function" inurl:"addentry.php" -"error" -"warning" site:.com
по сути дела это inurl:"addentry.php", только убираем косяковые с error и warning, а так же чтобы в ссылке не встечались html и Function и чтобы прощупывалось в зоне com
Гугл красиво находит 14900 результатов
Поглядев на результаты видим, что очень часто встречается "guestbook/addentry.php"
Возьмем и исключим этот вариант дополнив запрос, чтобы выглядел так:
-inurl:"html" -inurl:"function" -inurl:"guestbook/addentry.php" inurl:"addentry.php" -"error" -"warning" site:.com
Гугл честно находит 989 ссылок.
Т.е. получается что с запросом мы угадали и что "guestbook/addentry.php" это основное окончание большинства страниц, а точнее (14900 - 989 = 13911 ссылок с таким окончанием)
Дабы развеять все сомнения проверяем:
-inurl:"html" -inurl:"function" inurl:"guestbook/addentry.php" -"error" -"warning" site:.com
И вот тут наступает странный момент
Гугл выдаёт всего 642 результата.
а куда же делись остальные? (а точнее 13911 - 642 = 13269 ссылок)
Куда они делись то? Может я что-то не так делаю? Может где в запросах ошибка какая?
читать
http://www.umaxforum.com/topic/9/12471/
MORE...