Sat Jan 07, 2006





ГлавМед
- подробнее читать тут



поставьте срочно заплату



http://www.microsoft.com/technet/security/bulletin/ms06-001.mspx

от недавнешнего картиночного вируса


Опубликовал: GreenWood on Jan 07, 06 | 2:42 pm | Profile

[0] comments (2008 views) |  [0] Trackbacks   [0] Pingbacks

Wed Jan 04, 2006





ГлавМед
- подробнее читать тут



стабилизатор серверных загрузок .... защита от ботов

http://siag.nu/pen/

Опубликовал: GreenWood on Jan 04, 06 | 11:35 pm | Profile

[0] comments (2011 views) |  [0] Trackbacks   [0] Pingbacks

распределение траффика по нескольким серверам



http://httpd.apache.org/docs/1.3/misc/rewriteguide.html

Опубликовал: GreenWood on Jan 04, 06 | 11:32 pm | Profile

[0] comments (1917 views) |  [0] Trackbacks   [0] Pingbacks

Sun Dec 18, 2005





ГлавМед
- подробнее читать тут



при анализе конкурентов найти самый влиятельный связанный кейвуд



http://www.fortuneinteractive.com/SEMLogicDemo.php

Опубликовал: GreenWood on Dec 18, 05 | 9:09 am | Profile

[0] comments (2363 views) |  [0] Trackbacks   [0] Pingbacks

Tue Dec 13, 2005





ГлавМед
- подробнее читать тут



Как избежать песка (Sandbox)

ok get an old domain, something which google crawls, then put a subdomain on it ... newsite.olddomain.com original and copy the site exactly on the sub as it is in the orginal date last modifed to a few months after the domain was first registered ... yer i know that makes all the content look really really old ... lol

Ok add a Link from the real site something like www.newsite.com ( forget about seo anchor text links, these are just to let google in).. now 301 the subdomain to the new site..


Опубликовал: GreenWood on Dec 13, 05 | 6:59 am | Profile

[0] comments (2430 views) |  [0] Trackbacks   [0] Pingbacks

Wed Nov 30, 2005





ГлавМед
- подробнее читать тут



TrustRank

http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=2004-17&format=pdf&compression=&name=2004-17.pdf

рекомендуется SE копателям-математикам

Опубликовал: GreenWood on Nov 30, 05 | 12:05 pm | Profile

[0] comments (3940 views) |  [0] Trackbacks   [0] Pingbacks

Гугль - бомбинг



http://microcontentnews.com/articles/googlebombs.htm




http://www.uber.nu/2001/04/06/

Опубликовал: GreenWood on Nov 30, 05 | 9:46 am | Profile

[0] comments (2523 views) |  [0] Trackbacks   [0] Pingbacks

Sun Nov 27, 2005





ГлавМед
- подробнее читать тут



как удалить ненужные странички из выдачи гугли

The current situation: Google refuses to recognize a 301 of a Supplemental listing. Google refuses to delete a Supplemental listing that is now a nonexistent 404 (not a custom 404 page, a literal nothing there) no matter if it is linked to from dozens of pages. In both the above situations, even if Google crawls through links every day for six months, it will not remove the Supplemental listing or obey a 301. Google refuses to obey its own URL removal tool for Supplementals. It only "hides" the supplementals for six months, and then returns them to the index.

As of the past couple days, I have succeeded (using the below tactics) to get some Supplementals removed from about 15% of the datacenters. On the other 85% they have returned to being Supplemental however.

Some folks have hundreds or thousands of this type of Supplemental, which would make this strategy nearly impossible, but if you have less than twenty or so...

1) Place a new, nearly blank page on old/supplemental URL.

2) Put no actual words on it (that it could ever rank for in the future). Only put "PageHasMoved" text plus link text like "MySiteMap" or "GoToNewPage" to appropriate pages on your site for a human should they stumble onto this page.

3) If you have twenty supplementals put links on all of them to all twenty of these new pages. In other words, interlink all the new pages so they all have quite a few links to them.

4) Create a new master "Removed" page which will serve as a permanent sitemap for your problem/supplemental URLs. Link to this page from your main page. (In a month or so you can get rid of the front page link, but continue to link to this Removed page from your site map or other pages, so Google will continually crawl it and be continually reminded that the Supplementals are gone.)

5) Also link from your main page (and others if you want) to some of the other Supplementals, so these new pages and the links on them get crawled daily (or as often as you get crawled).

6) If you are crawled daily, wait ten days.

7) After ten days the old Supplemental pages should show their new "PageHasMoved" caches. If you search for that text restricted to your domain, those pages will show in the results, BUT they will still ALSO continue to show for searches for the text on the ancient Supplemental caches.

8) Now put 301s on all the Supplemental URLs. Redirect them too either the page with the content that used to be on the Supplemental, or to some page you don't care about ranking, like an "About Us" page.

9) Link to some or all of the 301ed Supplementals from your main page, your Removed page and perhaps a few others. In other words, make very sure Google sees these new 301s every day.

10) Wait about ten more days, longer if you aren't crawled much. At that point the 15% datacenters should first show no cache for the 301ed pages, and then hours later the listings will be removed. The 85% datacenters will however simply revert to showing the old Supplemental caches and old Supplemental listings, as if nothing happened.

11) Acting on faith that the 15% datacenters will be what Google chooses in the long run, now use the URL removal tool to remove/hide the Supplementals from the 85% datacenters.

Will the above accomplish anything? Probably not. The 85% of the datacenters may just be reflecting the fact that Google will never under any circumstances allow a Supplemental to be permanently removed. However, the 15% do offer hope that Google might actually obey a 301 if brute forced.

Then, from now on, whenever you remove a page be sure to 301 the old URL to another one, even if just to an "About Us" page. Then add the old URL to your "Removed" page where it will regularly be seen and crawled. An extra safe step could be to first make the old page a "PageHasMoved" page before you redirect it, so if it ever does come back as a Supplemental, at least it will come back with no searchable keywords on the page.

Examples of 15% datacenter: 216.239.59.104 216.239.57.99 64.233.183.99
Examples of 85% datacenter: 216.239.39.104 64.233.161.99 64.233.161.105


Опубликовал: GreenWood on Nov 27, 05 | 7:31 am | Profile

[0] comments (4536 views) |  [0] Trackbacks   [0] Pingbacks

Sat Nov 26, 2005





ГлавМед
- подробнее читать тут



Open letter to Matt Cutts - открытое письмо матт кутту ... гы .. на слабо под%ули

Dear Matt,
Sorry it falls on you! We at DarkSeoteam appreciate your blog, respect your work… and you look like a nice guy. But your blog looked like the perfect target. First because you don’t rely on it for income, second because, on the internet, there is no better proof than a punchy example.
As many fellow webmasters, we have been reading the endless threads at webmasterworld, where site owners were complaining for having their websites “Googlewashed”, and income hurt by unscrupulous competitors.
As many fellow webmasters, we were shocked that Google and GoogleGuy did not even dare to comment.
Matt ! Google doesn’t have to feel ashamed for the bugs. Everyone involved in software and algorithms can understand what bug means for real. We all had bugs. The only thing we can’t understand is that Google doesn’t say it’s going to fix it asap.
We won’t make public the way we ranked on "bacon polenta"because we don’t want the technic used spreading on the web. However, it seems that many posters at webmasterworld and threadwatch understood the whole thing. But that’s not the point.
The point is:
Anyone can use Google’s duplicate content filters to ruin a competitor’s website, and steal his ranking and traffic.

Moreover, Matt, the webmasters' community does not need an immediate fix, but it needs Google to admit that it is not able to differentiate between the original contents and the duplicate one, and it needs to hear that Google is working hard on fixing this severe issue.
Last thing Matt. You said at threadwatch that you were not going to do anything special for your blog. It honors you, but beware that the whole thing could worsen in the next days. Not that we are going to do anything else about it, but our test is very recent. It was just set-up on September 25 (yeah, less than 10 days to get a visit from GoogleGuy, we’re proud lol), and Googlebot has not finished his job yet.
As we said Matt, we’re leaving the test "as it is". Hopefully you guys in the Googleplex can use it as a "cobaye" to fix your algo. After all, our site is just a lab, and you’re welcome to use it.
The DarkSeoTeam
For those who would not understand what we are taking about here, read the following threads:
- Google's Matt Cutts' Blog GoogleWashed (Thx again Nick)
- The initial wmw's thread about all this ( No thx to stupid moderators that delete all the post about this ..)

оригинал тут http://www.darkseoteam.com/

кто не понял об чем речь, поясняю ... это когда сделали сайт с псевдопиаром 10 http://www.pr10.darkseoteam.com
ну у гугли хватило ума только забанить его, проблему вроде как и не решили до сих пор ..а впрочем читайте ключевую фразу :

Anyone can use Google’s duplicate content filters to ruin a competitor’s website, and steal his ranking and traffic.


Опубликовал: GreenWood on Nov 26, 05 | 12:49 pm | Profile

[0] comments (2353 views) |  [0] Trackbacks   [0] Pingbacks

Tue Nov 15, 2005





ГлавМед
- подробнее читать тут



Поисковики работают по-честному

Широко распространено мнение, что первые позиции в поисковиках приносят сайту популярность за счет тех ресурсов, которые по каким-то причинам расположились в поисковой выдаче далеко внизу страницы или вообще не попали в нее.



А дальше получается замкнутый цикл, при котором у ресурса, оказавшегося наверху, поднимается индекс цитирования, а из-за этого его позиция в поисковике становится еще более устойчивой. Таким образом, получается, что ресурсам с нижних строчек в поисковике уже никогда не выбраться из забвения, как бы они не старались и не повышали качества контента.


Однако, исследование http://arxiv.org/abs/cs.CY/0511005 , проведенное совместно учеными из США и Германии (университеты Santo Fortunato, Indiana University и University of Bielefeld), показало, что эти выводы не совсем верны. Они проанализировали сетевой трафик и пришли к выводу, что поисковики дают трафик как популярным проектам, так и непопулярным.


В рамках исследования был проанализированы переходы с поисковых систем Alexa, Google и Yahoo на 28 164 сайта. На основе анализа была составлена теоретическая модель, которая учитывает факторы, влияющие на поисковую выдачу. Эти факторы можно объединить в три группы: поисковый запрос, способ ранжирования результата поисковиком, использование поисковой выдачи человеком.


Ученые построили график зависимости трафика с поисковых ресурсов от индекса цитирования сайта. Ранее предполагалось, что зависимость трафика от количества ссылок на ресурс растет по экспоненте. На деле же оказалось, что зависимость всего лишь линейная.



k - количество ссылок на ресурс


По мнению исследователей, к их результатам стоит присмотреться разработчикам поисковых систем, веб-мастерам, интернет-рекламистам. Для последних, например, данные исследования помогут лучше прогнозировать отдачу от рекламных кампаний в Сети.


Также, по их мнению, это очень важная информация для социологов. Поскольку в современном мире технологии поиска в интернете становятся основным интерфейсом между человеком и знаниями, важно понимать, как происходит обнаружение информации и ее обработка конечным пользователем.

webplanet.ru

Опубликовал: GreenWood on Nov 15, 05 | 6:10 pm | Profile

[0] comments (4205 views) |  [0] Trackbacks   [0] Pingbacks

Sun Nov 13, 2005





ГлавМед
- подробнее читать тут



Web Spam

пытливым http://www-db.stanford.edu/~zoltan/publications/gyongyi2005web.pdf

Опубликовал: GreenWood on Nov 13, 05 | 5:05 pm | Profile

[0] comments (5043 views) |  [0] Trackbacks   [0] Pingbacks

Fri Nov 11, 2005





ГлавМед
- подробнее читать тут



TrustRank - очередная методология определения спама

http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=2005-33&format=pdf&compression=&name=2005-33.pdf

Документ в формате pdf

Кому лень читать этот большой документ, вот выжимка кривого перевода сути :

* .edu и .gov любовь - реальная сделка, и затем некоторые
* Don’t Боится получения несколько spammy ссылок (все имеют некоторые).
* TrustRank МОЖЕТ денагрузить эффекты некоторым spammy ссылок, но поскольку наиболее spammy ссылки имеют низкую оценку руководства они не включают высокий процент вашей популярности ссылки если у вас есть немного ссылки высокого качества.
* Если Вы можете получить несколько хорошо узнанное поверившему ссылкам Вы можете стать прочь с иметь много spammy ссылок.
* Эти типы алгоритмов работают на относительной основе. Если Вы можете получить более традиционный способ компенсации чем конкуренция, которыми Вы можете стать прочь с иметь связка более ссылки рухляди также.
* Продолжая на, что последняя точка, некоторые места могут преуспевать несмотря на некоторые вещи, они делают. Если Вы стремитесь копировать профиль связи конкурента убеждаться Вас тратить некоторое время, строящее немного данные связи серьезного качества перед ходить после слишком много spammy или полу spammy ссылок.
* Человеческий обзор здесь должен остаться алгоритмами поиска. Люди только собираются получать более важный. На рабочих, дистанционные ругатели качества, и обратная связь пользователя и маркировки дает двигателям поиска другой слой, чтобы формироваться на за анализом ссылки.
* Только несколько ссылок качества - нужно ранжироваться в Google во многих областях.
* Если Вы можете получить ресурсы права, чтобы быть заинтересованно в связи вашего пути (непосредственно или косвенно) качество в теме высоко .edu ссылка PageRank может иметь смысл немного серьезные наличные.
* Иногда дешевый путь получать те типы ссылок создаст причины или linkbait, который может быть внешним в вашем основном сайте.


Опубликовал: GreenWood on Nov 11, 05 | 7:25 am | Profile

[2] comments (5741 views) |  [0] Trackbacks   [0] Pingbacks

Tue Nov 08, 2005





ГлавМед
- подробнее читать тут



Выкладываю кривой машинный перевод - полезная инфа

Патент Google: Индивидуализация Установленного Содержимого, заказывающегося в Результаты Поиска

Это - итог Google’s последний патент в персонализировать результатах поиска. It’s В аналогичном формате как Статистические Данные Rand’s сообщение для двух причин. Первая причина - для согласованности, I’m, принимающий все знакомы с его сообщением и таким образом будут знакомы для этого формата. Причина Секунды - поскольку Я can’t обдумывать лучший формат.

Все здесь - моя собственная интерпретация патента.

Обзор Важных Понятий
Эти понятия - что Я верю, наиболее важные для машинных оптимизаторов поиска и marketers, чтобы понимать для того, чтобы выигрывать из этого сообщения.

Цель Google’s, чтобы Поиск “Персонализирует”

Google Понимает, что к настоящему времени не все результаты поиска важные для всех. Например, если кто-нибудь ищет “ежевику”, как делает Google знает если Вы ищете ежевичные устройства или черная ягода для кухни? В зависимости от искателя, одна тема будет более важной чем другое. Для того, чтобы представлять лучшие результаты поиска, персонализировавшие результаты возьмет user’s профиль (что позже) в соображение. Так не только будет Google ранжирует websites в типичных показателях (связь, текстовый анализ, сквозной тариф щелчка) но они теперь включат историческая информация пользователя.

Параметры Пользователя

Параметры пользователя основано в истории пользователя. Патент особо очерчивает: история запроса поиска пользователя, документы возвращались в результаты поиска, документы посещался в результатах поиска, якорного текста документов, тем документов, уходящих связей документов, сквозного тарифа щелчка, формата документов, истраченного смотреть времени на документ, время истраченных перемещая документ, напечатан документ/bookmarked/сохраненное, визиты повторения, просмотр образца, группы индивидуумов с аналогичным профилем, и пользователь подавал информацию. Все эти данные могут быть mined программами Google уже выпустил – Поиск Google Desktop, Персонализировавший История Поиска, и Google Toolbar.

История Запроса Поиска

Одно из больших понятий патента - использование Google’s истории запроса поиска. Google Формирует профиль основанный в прошлых поисках, но они прослеживают много больше вещей чем прежде подумал. Они - использующие прошлые запросы поиска, чтобы формировать профили срока пользователя и затем сравнивая профили срока с профилями установленного содержимого (рекламы). Они также выполняют анализ в исторических документах поиска, чтобы вычислять какие типы интереса документов Вы. Данные Связи сыграется большую роль здесь.

Профиль Содержимого

Профили Содержимого будут сгенерированы для реклам. Довольные профили состоят из категорий (комплекты условий) отображенных в удельный вес. В основном система величины – например категория видов спорта может состоять из условий “баскетбола”, “футбол”, и “футбол” – каждая категория с переменным весом основанным на relevancy в содержимое. Время, чтобы читаться по на характеризовать-векторе весовых коэффициентов. Эти удовлетворяют профили - затем по сравнению с параметрами пользователя для того, чтобы генерировать оценку сходства для ранжирования.


Что - Google, пытающийся, чтобы измерять?

Google Хочет измерять, пытаться измерять, или уже меры:

Информация Документа

Текстовый Анализ
Данные Связи
Тематический Анализ
Персональная Информация

Демографический
Географический
Онлайн Поведения Пользователя

Запросы Прошлое Search
Посещенные Документы
Щелкните Сквозной Тариф
Образец Поиска
Образец Просмотра
Образец визита Документа
Время истраченное рассматривая документ
Сумма рассмотренного документа
Аналогичные пользователи
Визиты/поиски Повторения
Любимые хосты/места
Пользователь Behavior Offline

Bookmarked Располагается
Сохраненные места
Предпочтение формата Документа
Языковое предпочтение Документа
Сохраненный Текст (копия/паста)
Отпечатанные документы
6. Влияние

Это - где двигатели поиска возглавляют. Персонализировать средства поиска лучших результатов поиска, так что каждый планируя, чтобы продолжать машинный маркетинг поиска, которым нужно понимать как индивидуализация собирается влиять на будущее поиска.

Analysis/Interpretation 52 ПАТЕНТНЫЙ Компоненты
Индивидуализация Реклам

1. Реклама персонализирует основанное по интересам пользователя и параметр пользователя. Предположим, это проведет к более эффективным кампаниям объявления, это предназначается более деньги для Google и лучше лидирует для предприятий.
2. Предложение является показателем в ранжировании заказа (что касается параметр пользователя). Это учитывает более специфический предлагая более высокую цену будущее. Полагайте, что Вы только захотите нацелить специфическое параметры пользователя, Вы можете установить выше/более низкие предложения основывался в профиле вместо запроса поиска.
3. Щелкните сквозной тариф является показателем в ранжировании заказа. Кроме того это обусловливается параметрами пользователя.

Запрос Поиска

4. Реклама персонализирует основанное на старых запросах поиска и параметр пользователя. Прошлые запросы поиска уже сохраняются Историей Поиска Google.
5. Предложение является показателем в ранжировании заказа.
6. Щелкните сквозной тариф является показателем в ранжировании заказа.

Задирание Откладывается для Размещения Объявления

7. Реклама персонализирует основанное на запросе поиска, параметр пользователя, сопоставление содержимого установленных, сквозной тариф предложения и щелчка.

История Поиска

8. Параметры пользователя частично основано в условиях запроса предшествующего поиска.
9. Параметры пользователя также основывалось в результатах поиска возвращанных. Для каждого следующего документов, Google проверяет пользователя, просматривающего образец (визиты, время тратило, связи сопровождал), анализ документа (текстовый, якорный текст, связь), и offline образец (печать, сохраняющий, частичный сохраняемый).
a. Документы указанные в результатах поиска
b. Документы связанные, чтобы этими документами (a)
коэффициент насыщения кирпича. Документы просмотренные пользователем
d. Документы связанные, чтобы документами просмотренными пользователем

Оценка Сходства

10. Оценка сходства вычислена, чтобы определять как связавшее содержимое - в параметрах пользователя.
11. Параметры пользователя категории веса - по сравнению с весом категории профиля содержимого определять оценку. Быстрое и грязное объяснение: условия в рекламе иметь отношение к условиям в параметрах пользователя. I’d Рекомендует читаться по в характеризовать-векторном весе.
12. Масштабный коэффициент приложен.
13. Соедините масштабный коэффициент в связку других вещей (дополнительно о этому позже).
14. Оценка состоит из масштабного коэффициента, предложения, и сквозного тарифа щелчка.
15. Больший оценка, более низкий масштабный коэффициент.
16. Масштабный коэффициент определен сквозным тарифом щелчка и оценки сходства.
17. Опечатка? Имеет отношение к претензии 71, но нет претензии 71.

Сервер Рекламы (Google Мини)

18. Сервер, который назначает оценки в другие рекламы основанные на relevancy в параметры пользователя. Идентифицирует рекламу, которая будет интересной пользователю. Это звучит подобно google мини для порции персонализировавшей реклама.
19-34. Тот же материал как 1-17.

Программное обеспечение (Google Desktop/Toolbar)

35. Программа для эвм, которая идентифицирует интересы пользователя и обслуживает персонализировать содержимое. Звуки подобно Google Desktop и персонализировать рекламе.
36-51. Тот же материал как 1-17.

Система

52. Google Сначала берет запрос поиска, затем это находит параметры пользователя, захватывает содержимое объявления, которое соответствует запросу поиска, сравнивает содержимое объявления с параметрами пользователя затем ранжирует содержимое объявления основанное в оценке интереса.

Описание Патента
Изобретение имеют отношение к двигателям поиска в сетевой среде (internet или intranet) и создание/использование параметр пользователя, чтобы ранжировать содержимое (рекламы и результаты поиска).

Фон

Перед было PageRank, теперь есть Индивидуализация.

Каждый пользователь имеет его собственные предпочтения когда он подает запрос в двигатель поиска. Качество результатов поиска возвращанного двигателем должно быть оцененн своими пользователями’ удовлетворение. Когда user’s предпочтения могут хорошо определены запросом себя, или когда user’s предпочтение подобное произвольному surfer’s предпочтению что касается специфического запроса, пользователь - более вероятно, чтобы быть удовлетворенн результатами поиска. Тем не менее, если user’s предпочтение значительно просклонено немного персональными показателями, что ясно не отражены на запросе поиска себе, или если user’s предпочтение отличается от произвольного user’s предпочтения, поиск происходит из того же двигателя поиска может быть менее полезным пользователю, если не бесполезный.

Итог

Google Собирается использовать историческую информацию, чтобы генерировать параметры пользователя. Это параметры пользователя будет использовано, чтобы ранжировать машинные результаты и рекламы поиска.

Чертежи

Иллюстрирует все, что Я проходил через прежде.

Описание Реализаций

Это - объяснение всех точек представленных раньше. I’d Рекомендует все действительно проводя время, чтобы читать эту часть в патенте.

Параметры Пользователя

Google Генерирует параметры пользователя основанное в данных с user’s прошлой деятельности поиска. Google Описывает некоторые различные информационные источники, которыми они чувствуют иметь важное значение достаточно, чтобы прослеживаться.

Google Использует прежде представленные запросы поиска, чтобы помогать определять user’s интерес. Если пользователь последовательно ищет документы имело отношение к специфической теме, Google делает вывод, который пользователь будет заинтересован в этой теме. URLs И якорный текст также используется, чтобы определять интересы. Что Я нахожу реальный интересно -, что Google особо указывает URLs и якорный текст результатов поиска – наиболее время якорный текст результата поиска является страничным названием, так что here’s яркий пример значения страничного названия для машинного маркетинга поиска.

Определенные Документы

Документы, что Google находит важный для параметр пользователя назван “определенный документ”.

Для целей формировать параметры пользователя, определенные документы из которых информация произойдена для включения в параметрах пользователя могут включить: документы идентифицировались результатами поиска из двигателя поиска, документов доступного (напр.., рассмотренный или загруженный, например использование окна просмотра приложения) пользователем (включая документы не идентифицировался в предшествующих результатах поиска), документы связывались в документы идентифицированные результатами поиска из двигателя поиска, и документы связывались в документы доступные пользователем, или любым подмножеством таких документов.

Для каждого идентифицировавшее документ, Google определяет: формат документа, какого языка документ - в (html/text/pdf/слово/и т.п.), тема документа, как пользователь отвечает на документ, время тратился рассматривая, перемещая деятельность, напечатанную, сохраненную, bookmarked.

Ключевые условия и их частоты проанализированы для каждого документа. (Срок-вес)

Просмотр Образцов

Другой источник информации, что дорожки Google является пользователем, просматривающим образцы. Это может быть число URLs посещалось в определенной временной рамке или как пользователь перемещает из одного URL на другое.

Возрастной Вес

Информация Профиля нагружена к возрасту, так что более последний информация более важный это. (Ссшлитесь на rand’s анализ)

Персональная Информация

Дополнительная персональная информация может быть использована, чтобы ранжировать содержимое.

Демографическая и географическая информация связывалась пользователем, как например, user’s возраст или возрастная группа, образовательный уровень или дипазон, уровень дохода или дипазона, языковых предпочтений, семейного положения, географической позиции (напр.., город, состояние и страна в которых пользователь находится, и возможно также включая дополнительную информацию как например, уличный адрес, почтовый индекс, и телефонный код области), культурный фон или предпочтения, или любое подмножество их.

Параметры Пользователя Состоит из Меньших Профилей

Параметры пользователя может быть сломано в три меньших профиля: базирующийся срок, основавший категорию, связь основывалась.

Термин-основавшее профиль представляет интерес основанный в специфических условиях. Эти профили показывают как важный специфический срок - пользователю. Если документ соответствует термину в течение user’s базирующегося профиля срока (тот же срок как в документе так и профиле), тогда документ назначен этот term’s вес. Уведомление как Я использую “срок” и не “слово”, дело в том, что термин может содержать более, чем одно слово. Вес термина может быть положительным или отрицательным. Положительный вес означает что пользователь заинтересован в видении, которое характеризуется в результатах, отрицательный вес означает противоположный.

С термин-основавшее метод имеет некоторые недостатки, базирующийся профиль категории - нужно также.

Базирующиеся профили Категории могут быть сгенерированы с карт категории подобно DMOZ каких документов групп под специфическими темами. Эти категории - затем взвешенное, чтобы представлять интерес пользователя. Эти категории определены историей поиска, urls идентифицированное предшествующими запросами поиска, общих сведений об определенных документах, sampled довольной, информации категории, и персональной информации пользователей. Базирующиеся профили Категории нет должны быть актуально организованн. Они могут быть организованы форматом, позицией, началом, языком, и т.п.. Google Особо указывает, что тип документа может иметь другой вес:

В одной реализации, user’s предпочтение может быть распределено основанное в форматах документов идентифицированных пользователем, как например, HTML, простой текст, PDF, Microsoft Word, и т.п.. Другие форматы могут иметь другой вес. В другой реализации, user’s предпочтение может быть распределено согласно типам определенных документов, напр.., organization’s homepage, person’s homepage, научно-исследовательская бумага, или групповое почтовое отправления новостей, каждый тип, имеющий связанный вес.

Дополнительно к базирующейся категории и основавшим профили срока, основавшие профили связи также использованы. Базирующиеся профили Связи определены PageRank, список urls часто доступный, время тратилось в url, предпочтительных хостах. Субдомены передают величину в родительскую область. Вес определен как значительно документ - из установления документа. Так например если результат поиска возвращает homepage для Машинных Часов Поиска и с этой страницы, Вы можете достичь SEOmoz на двух связях и моем сайте на одной связи, мой сайт будет иметь больший вес.

Анализ Срока

Здесь Google разговаривает немного о том, как они выполняют анализ документа.

Данный конкретный документ, Google определяет величине специфических условий позицией и значением. Например они указывают, что document’s название может быть очень важным тогда как навигация/авторские утверждения/опровержения - не как важный.

Дискретизация Параграфа

Предположим, менее важное содержимое является обычно короткими сегментами текста, Google находит наиболее важные области содержимого. Дискретизация Параграфа ищет самые длинные параграфы в документе. Параграфы - затем обработанное в заказе уменьшающей длины. Если есть не достаточно параграфов, чтобы анализировать, Google тогда тянет тексту из якорного текста и альт этикеток. Параграфы определены появлением в окне просмотра.

Контекстный Анализ

Содержимое - затем сканированное для образцов слова (префикс/постфиксный). Google Ищет слово перед и после специфического срока. Они затем дают вес в этот префикс/постфиксные слово. Специфический префикс/постфиксные слово может нагрузить более, чем другие. Так не только - Google, ищущий образцы в специфических элементах поиска, они ищут образцы в слове окружать элемент поиска.

Formulas/Calculations

Остальная часть чек, подлежащего оплате банками, не являющимися членами лондонской клиринговой палаты документа через немного обобщенные формулы и вычисления. I’m, Понуждающий все, чтобы читать эту часть, поскольку I’m не ходя, чтобы суммировать это.

Установленное Содержимое (реклама):
Каждое установленное содержимое связало профиль с ним. Сравните довольный профиль с параметрами пользователя затем получайте оценку сходства.

Оцените = банкноту достоинством 10 долларов масштабного коэффициента CTR банкноты достоинством 10 долларов предложения

Подготовка:
{ В течение каждого важного срока в документе { Для m = 0 на MaxPrefix { Для n = 0 в MaxPostfix { Экстрат m слово перед важным сроком и n слово после важного срока как s; Добавьте 1 к ImportantContext(m,n,s); } } } В течение каждого неважного срока в документе { Для m = 0 на MaxPrefix { Для n = 0 на MaxPostfix { Извлеките m слову перед неважным сроком и n слово после неважного срока как s; Добавьте 1 к UnimportantContext(m,n,s); } } } } Для m = 0 на MaxPrefix { Для n = 0 на MaxPostfix { Для каждой величины s { Установившей вес для s в функцию ImportantContext(m,n,s), и UnimportantContext(m,n,s); } } }

Контекстный Образец:
Вес(m, n, s)=Log(ImportantContext(m, n, s)+1)- Протокол(UnimportantContext(m, n, s)+1).

Общая Оценка Документа:
GenericScore=QueryScore*PageRank.

Персонализировать Оценка:
PersonalizedScore=GenericScore*(TermScore+CategoryScore+LinkScore).

Конечная Оценка:
FinalScore=ProfileScore*ProfileConfidence+GenericScore*(1-ProfileConfidenc- e).

Вывод

Google Разговаривает о другом используется для этой системы индивидуализации вне машинных систем поиска.

Например, в системе email или в фактически любой другой системе для обеспечения услуг через Internet или другую широкую сеть области, которая отображает документ или другое содержимое пользователю или подписчику, установившим содержимое может быть также выбран и отображен пользователю. Установленное содержимое может быть выбрано основанное в ключевых словах связанных установленным содержимым, сочетавшимся содержимое отображаемого документа или установленного документов, или может быть основано в других критериях выбора. Выбранные установленные предметы содержимого - затем заказанное основанное в сходстве параметр пользователя и профили выбранных установленных предметов содержимого, как описано выше.

Оригинал читать тут http://www.socialpatterns.com/search-engine-marketing/google-patent-personalization-of-placed-content-ordering-in-search-results/

Опубликовал: GreenWood on Nov 08, 05 | 9:40 am | Profile

[0] comments (2019 views) |  [0] Trackbacks   [0] Pingbacks

Mon Oct 31, 2005





ГлавМед
- подробнее читать тут



топология связей



http://www.touchgraph.com/TGGoogleBrowser.html

инструкция здесь http://www.touchgraph.com/TGGB_FullInstructions.html

есть над чем призадуматся

Опубликовал: GreenWood on Oct 31, 05 | 9:23 pm | Profile

[1] comments (2104 views) |  [0] Trackbacks   [0] Pingbacks

Гугл превратился в про-правительственную корпорацию.

1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается.
2. ГУГЛ ЗАПИСЫВАЕТ ВСЕ, ЧТО МОЖЕТ - cookie ID, IP адрес, время, дату и т.д. Гугл изменяет результаты в зависимости от IP-адреса (IP delivery based on geolocation)
[Например, насколько я помню один хороший пример, поиск из Германии не покажет ссылки на некоторые сайты, признанные "незаконными". Награды тому, кто догадается что это за сайты не будет, слишком просто - сайты, вскрывающие еврейское холокостничество и переписывание истории Второй Мировой - emdrone]
3. ГУГЛ ХРАНИТ ИНФОРМАЦИЮ ВЕЧНО. Есть свидетельства, что эта информация не просто в каких-то backups, но легко доступна.
4. ГУГЛ НЕ ОТВЕЧАЕТ, ЗАЧЕМ ЕМУ ЭТИ ДАННЫЕ. Запросы об их privacy policies игнорируются. Во время интервью с Сергеем Брином NYTimes (28 ноября 2002), он не стал отвечать на вопрос, используется ли эта информация в судебных запросах.
[По новым положениям акта "Патриот", кстати сам факт сообщения жертве факта поиска по ее private информации является преступлением - emdrone]
5. ГУГЛ НАНИМАЕТ АГЕНТОВ СЕКРЕТНЫХ СЛУЖБ. Мэт Катц (или Каттс), один из главных, старших инженеров, работал на NSA, Агенство Национальной Безопасности. Гугл хочет нанять больше работников имеющих допуски секретности.
6. ГУГЛ TOOLBAR - spyware, программа-шпион. Если включены advanced features, toolbar для майкрософтовского браузера Explorer "звонит" на Гугл каждый раз, когда вы читаете новую страницу, он считывает информацию cookie. Privacy Policy Гугла в этом признается, но только потому что компания Alexa в свое время проиграла судебное дело (class-action lawsuit), и их toolbar делал то же самое. Гугловский toolbar сам себя обновляет устанавливая новые версии не спрашивая вас, хозяина компьютера. Это означает, что если он присутствует на вашем компьютере, Гугл имеет доступ к файлам на вашем диске каждый раз, когда вы соединяетесь с Гуглом. Даже Майкрософт запрашивает, не хотите ли вы сделать upgrade - но не Гугл.
7. ГУГЛ "CACHE COPY" веб-страниц нарушает законы [копирайта, которого мне лично не жалко, но речь сейчас идет шире - о доступе к как он используется корпорацией - emdrone]. После удаления с вебсайта материалы продолжают появляться на Гугле.
8. ГУГЛ СОВСЕМ НЕ ДРУЖЕСТВЕННАЯ СИЛА - сейчас он обладает 75% монополией на внешние ссылки большинства вебсайтов. Вебмастеры не могут не ублажать Гугл если они хотят усилить траффик. Если они ведут себя "неправильно" (например, экспуатируя слабости полу-секретных, полу-известных алгоритмов ранжирования страниц Гуглом), они неожиданно могут обнаружить, что наказаны, и traffic на их сайтах исчезает [т.е. Гугл подправляет ранг их страниц, засовывая в задницу - emdrone]. Гугл не опубликовал никаких стандартов по этим вопросам, для наказанных не существует процессов апелляции. Гугл совершенно не подчинен никому. В большинстве случаев, он просто не отвечает на e-mail'ы вебмастеров.
9 ГУГЛ - БОМБА ЗАМЕДЛЕННОГО ДЕЙСТВИЯ В СМЫСЛЕ ВОПРОСОВ PRIVACY. Обслуживая около 200 миллионов поисков в день, большинство из-за пределов США, гугл - катстрофа, которая может случиться в любой момент. Васхингтонские бюрократы могут только мечтать о той изящной эффективности в сборе данных, которой добился Гугл.


читать полностью http://www.livejournal.com/users/emdrone/133835.html?mode=reply

Опубликовал: GreenWood on Oct 31, 05 | 9:05 pm | Profile

[1] comments (2569 views) |  [0] Trackbacks   [0] Pingbacks

Sat Oct 29, 2005





ГлавМед
- подробнее читать тут



генерация контента по алгоритму цепей Маркова с примерами

http://www.cs.bell-labs.com/cm/cs/pearls/sec153.html

Опубликовал: GreenWood on Oct 29, 05 | 2:23 pm | Profile

[0] comments (3000 views) |  [0] Trackbacks   [0] Pingbacks

Tue Oct 18, 2005





ГлавМед
- подробнее читать тут



смена хостера и ip

пошаговые советы при смене хостера и ip и что-бы в гуле все было ок

http://www.mattcutts.com/blog/moving-to-a-new-web-host/

Опубликовал: GreenWood on Oct 18, 05 | 5:17 pm | Profile

[0] comments (2274 views) |  [0] Trackbacks   [0] Pingbacks

Tue Oct 04, 2005





ГлавМед
- подробнее читать тут



приклеится к пиаристому сайту

Многие спрашивают как склеить свой дор с пиаристым сайтом и получить видимость большого псевдопиара .
Сам я этого не делал ( не было необходимости ) и что-б долго не иследовать разные комбинации просто спросил одного опытного нашего товарища ... ну вот так по нашему по простому и спросил :)
значит делать их можно при посредстве следующего :

301,
302,
рефреш,
контент,
клоака,
фрейм,
комбинированная

самая простая склейка - 301 редирект со своего на жертву, далее убираем...
эффект остаётся непродолжительное время (в зависимости от частоты индексации нашего сайта)

Опубликовал: GreenWood on Oct 04, 05 | 7:29 pm | Profile

[5] comments (3008 views) |  [0] Trackbacks   [0] Pingbacks

Sun Oct 02, 2005





ГлавМед
- подробнее читать тут



что такое пиар - начинающим

Так-как начинающие часто слыхали что такое пиар .. но понимают его смутно, то попробую на пальцах обьяснить подоходчивей.

Представим себе что вам начальник дал задание подобрать литературу, надергать оттудова заданную инфу ( ну скажем о куроводстве ) и подготовить этому начальнику доклад ... типа что-бы он выступая на симпозиуме куроводов мог читая ваш подготовленный доклад выглядеть умным и шибко знающим эту тему.
Ваши действия ?
есть два варианта :
1.набрать журналов и книг и читать всю ночь и утром так ничего и не поняв вылететь с работы или начальник облажается читая ваш доклад - что несутся не куры а петухи.
2.набрать журналов и книг по этой теме и обратиться к специалистам ... а вот тут самое интересное.
У вас к примеру 10 журналов.
Вы идете к студенту 1-го курса птичьего института и просите указать какой один журнал лучше выбрать для чтения. Так-как студент - кур видел только в супе то и авторитет его в этом вопросе мал ... поставим ему пиар = 1. Он конечно себя таким не считает . Но проверить это можно просто. Спросим 10 доцентов про студента и они скажут что он дуб ( ссылок на студента от доцентов нету ) ... но если спросим 10 студентов об авторитете нашего студента .. то те ..такие - же дубы скажут что да ( 10 ссылок с пиаром =1 на студента ) ... он щибко умный. Но и тут вы можете спросить доцентов про уже этих 10 студентов и доценты скажут что студенты бестолковые и сидят без степендии и кур даже в супе не видают ( ссылок нет ). Дав всем 11 студентам по 10 рублев на трамвай и взамен получив от их 11 автографов (ссылок) - вы начинаете кумекать дальше.
Вывод : если вам студент посоветует читать 5 журналов из 10 то верить ему как вы понимаете не стоит. Но не будем унижать нашего студента .. все таки он правильно указал на журналы по куроводству а не по коневодству.
Дальше идем к доценту ( у него пиар =3 ) . На него как на специалиста указали 100 студентов-дубов ( 100 ссылок с пиаром =1 ).
Теперь понятно ... откуда у доцента пиар =3 . Этот доцент вам посоветовал прочитать 3 журнала.Вы подарив ему ящик пива и килограмм кильки получаете в благодарность от его автограф ( ссылку) Но вас и это не устраивает ( время мало отведено ) . Тогда вы идете к проффесору у которого пиар = 5 . На него указало 100 студентов с пиаром -1 и 20 доцентов с пиаром =3. Это проф вам посоветовал прочитать один журнал и ему можно доверять, но вас и это не устраивает...вы уже в азарте. Тем не менее подарив ему свой старенький мотоцикл - взамен получете автограф ( ссылку ) Далее вы за советом идете к академику с пиаром =7 . На него указали 100 студентов, 20 доцентов и 10 профессоров. Академик посоветовал прочитать из журнала только одну главу в 5 листов и ему уж точно можно верить, но вам уже и это лень читать. И все равно сводив его в ресторан и оплатив ему такси вы получаете от его ссылку с пиаром = 7. Дальше по наводке этого академика Вы идете к нобелевскому лауреату по клонированию циплят и у его пиар = 9 . На его сослались 100 студентов, 20 доцентов и 10 профессоров и 5 академиков. Этот лауреат показал вам два предложения и сказал.. что если ты их прочитаешь с конца наперед ... то типа познаешь куринное царство. Напоследок купив ему швейцарские золотые часы в подарок и получив взамен от его автограф ( ссылку на себя ) - вы пошли выкручивать два предложения наизнанку. Утром - принеся эту абракадабру своему шефу .. радостно нашептываете ему о неком ближайшем открытии. Шеф и так озабоченный своей любовницей с недоверием читает ваше творение и понимает - делать ему на конфе нечего и посылает туда Вас. Вы смело вваливаетесь во дворец науки и залезаете на трибуну со своим докладом. Прочитав два магических предложения - слышите в ответ угрюмую тишину зала. Не надо пугаться ( или вы наивно подумали что они будут голову ломать над вашей фразой ? как бы не так ... вот так и Гугля ни хрена не анализирует а только ссылки -беки на вас считает и пиар вычисляет)... зал наполненный академиками, профессурой, доцентами и студентами лихорадочно проверяет ссылки на вас ... стоит -ли вам доверять. Обнаружив на вас все вышеуказанные ссылки - зал присваивает вам пиар = 10 и буря оваций, цветов сопровождаеться выносом вас на руках академиков в банкетный зал. Вы в гугле по запросу "куроводство" первый.

Конечно все это аналогии.
Суть состоит в том что достаточно иметь 2 ссылки с пиаром 7 на свой сайт, что-бы заменить к примеру 1000 ссылок с пиаром =1 или 500 с пиаром 3 или 50 с пиаром =4 .... ну и так далее. Но надо помнить еще одну важную вещь - чем больше пиар, тем чаще бот гугли приходит на сайт/дор и проверяет обновление... соотвественно если там есть изменения то меняется и кэш дора в выдаче гугли. Но если там редкие изменения по времени, то и гугля все реже и реже приходит на сайт и соотвественно это скажется и на местоположение в выдаче документа.

Вот в чем его приктическая необходимость.

p.s Все цифры "с потолка" и приведены только для наглядности и понимания сути пиара.

если что-то поняли из того что я тут наплел, то дальше вам сюда http://digits.ru/articles/promotion/pagerank.html

Опубликовал: GreenWood on Oct 02, 05 | 7:05 pm | Profile

[0] comments (2536 views) |  [0] Trackbacks   [0] Pingbacks

как спамить

Читатель пишет :
Гринвуд, мучает меня вопрос.. Есть сайт, на нем 15000 страниц (доров), все они перелинкованы между собой
(деревообразная структура). Вопрос как спамить:
a) Делать все ссылки на страницу по кейворду с самым большим_бидом/высокочастотником (т.е. допустим с 1500 ресурсов
1500 ссылок на одну страницу за один день).
б) Спамить несколько основных страниц (допустим 5, по 300 ссылок на каждую за один день)
в) Другой вариант (какой?)

\"За один день\" написано специально, не уверен, что это правильно.

Твои комментарии..

Ответ:
дело в том что спамить все странички конечно здорово ... это я бы сказал супер, но проблема состоит в мощности спамилок ...представьте себе что у вас 1500 дорвеев и каждый имеет 1500 страничек и надо проспамить в 1500 гостивух ... тык .. это чего у нас получается .. блин не охота калькулятор искать ... ну в общем цифра получится астрономическая ( возможно и доходы будут сопоставимы )
но ..тогда ведь при таком раскладе можно и себя вытолкнуть из гостевых собственными ссылками.
Тут тогда надо базу гостивух или каких подобных ресурсов не менее 150 000 и уже как то распределять все это хозяйство или по времени спама или по колличеству урлов страничек на одну гостивуху ...короче вариантов много в том числе и по стоимости бидов кейвудов.
Вообще почитайте про пиар ..как он распределяется по страничкам, тогда возможно можно существенно сократить за счет хитромудрой перелинковки.
Кстати там премудрость не такая уж и великая ..самая простая и эффективная схема :
если хочешь на доре нагнать пиар на одну какую-то страничка за счет других, то ставь линк со всех на одну искомую а с ее уже один линк на карту дора. Так-же делается и на 2..3..4.. странички .. ну а когда все перелинковано то и пиар распределится внутренний ну примерно одинаково.
Тут надо ставить преоритеты.
А если жадность обуяла и охота пиар поднять у всех и сразу то тогда спамить все внутренние странички как я и сказал выше.

нее ..мой разум такими цифрами оперировать отказывается :)

Опубликовал: GreenWood on Oct 02, 05 | 4:49 am | Profile

[1] comments (2555 views) |  [0] Trackbacks   [0] Pingbacks
PREV page Предыдущие новости --->

ppc


Партнерские программы


Google
 
Web bloggreenwood.com
черное море















#1 Online pharmacy
affiliate program!