Остерегайтесь "нехороших квартир"

Роман "Мастер и Маргарита" экранизировался не один раз. Первая экранизация принадлежит известному польскому режиссеру Анджею Вайде, который в 1971 году снял фильм "Пилат и другие". В 1972 году на экраны вышел итало-югославский фильм "Мастер и Маргарита" режиссера Александра Петровича. В 1988 году опять же поляк Мачек Войтышко снял по роману семи серийный фильм для ТВ.
http://masterimargarita.ru/
p.s
странный фильм ..странные события вокруг экранизаций - будьте осторожны при просмотре в декабре по ртр
[0]
comments (1734 views) |
[0]
Trackbacks
[0]
Pingbacks
Порноспамеры "влетели" на круглую сумму
Четверо владельцев сети порносайтов и обслуживавший их спамер заплатили штраф в размере 621000 долларов, чтобы уладить конфликт с Федеральной комиссией по торговле США (FTC). Последняя подала в отношении них иск о нарушении антиспамерского закона CAN-SPAM.
читать .. http://net.compulenta.ru/239599/
[0]
comments (1403 views) |
[0]
Trackbacks
[0]
Pingbacks
Онлайн-казино принесут своим владельцам 10 миллиардов долларов
По мнению экспертов компании eMarketer, 10 миллиардов долларов – это только чистый доход владельцев виртуальных игорных домов, а общий оборот интернет-заведений может составить в этом году свыше двухсот миллиардов.
читать http://nbsp.ru/news/2005/11/20/onlainkazino_prinesut_svoim_vladeltsam_10_milliardov_dollarov.html#more
[0]
comments (1655 views) |
[0]
Trackbacks
[0]
Pingbacks
Поиск. В этом и есть назначение интернета
Среднестатистический взрослый американец должен сделать в интернете три вещи: поискать "Гуглем" "Phentermine", кликнуть на дорвей, и почитать блог http://bloggreenwood.com
читать http://www.internet.ru/index.php?itemid=12962&catid=1
[0]
comments (1692 views) |
[0]
Trackbacks
[0]
Pingbacks
Поисковики затмили новостные ресурсы

Поиск в интернете становится все более массовым явлением. На сегодняшний день этот вид сетевой активности уступает по популярности только чтению электронной почты. Чтение новостей оттеснено на третье место.
читать ... http://www.cnews.ru/news/top/index.shtml?2005/11/22/192012
[0]
comments (3101 views) |
[0]
Trackbacks
[0]
Pingbacks
у меня идет ремонт ..
так что блог уже неделю по информативности довольно куций ...
ну не вечно-же этот ремонт продлится !
[0]
comments (1482 views) |
[0]
Trackbacks
[0]
Pingbacks
маленькая ложь рождает большое подозрение..
goodinfire
[0]
comments (1747 views) |
[0]
Trackbacks
[0]
Pingbacks
Прошла тусовка сеошников

я как всегда там не был ... блин ..сколько я их пропустил и все вечная занятость

http://public.fotki.com/SergeyPetrenko/seo_conf/searchenginesru-5/
[0]
comments (1566 views) |
[0]
Trackbacks
[0]
Pingbacks
Сервис для "медвежатников"
очередное применение карт гугли - ограбленные за последнее время банки
www.frappr.com/ackadia
[0]
comments (1582 views) |
[0]
Trackbacks
[0]
Pingbacks
newsmaster : Как бы я давил дорвеи, сделанные по «цепям Маркова»
Как бы я давил дорвеи, сделанные по «цепям Маркова»
В одном из постов ниже я выплескивал все свои гадкие мысли по поводу убийства дорвеев. Однако, есть класс дорвеев, который не убивается такими способами. Это дорвеи, генеренные с использованием цепей Маркова - они сохраняют грамматику оригинала (с пунктуацией, правда, проблемы, но ее отлавливать вряд ли возможно)
Что такое «цепи Маркова»?
Есть компьютерная игрушка - алгоритм, угадывающий мысли. Я тоже когда-то писал по нему программу . Мысли человек формулирует в виде последовательности ноликов и единичек, введенных в компьютер. А компьютер отвечает или не отвечает так: после того, как ты задумал число, он пытается его угадать, а ты потом его вводишь. Обманывать компьютер нельзя, это нечестно!
Через некоторое время он начинает прилично угадывать. Даже удивительно. А алгоритм основан на том, что датчик случайных мыслей (цифирок в человеке не случаен, а берет на вход предыдущие сгенеренные цифирки. И то, что следующим ходом человек сгенерит, определяется тем, какие цифры он сгенерил до того. И как ему компьютер отвечал (как вариант игры - он может угадывать втихую и не отвечать сразу, а отвечать потом).
Короче говоря, вся ситуация отслеживается на N ходов назад, и данные аккумулируются в таком виде: для каждой последовательности из N введенных ранее [0,1] считаем число введенных ПОСЛЕ этой последовательности единичек и число нулей. И считаем вероятность того, что человек введет следующим ходом. Если статистика по единичкам сильно больше, значит, «угадываем» единичку. Наоборот – ноль. Примерно одинаково – генерим случайно. А еще есть вариант игры с ответом «не знаю» в виде двойки, только тогда для эффективного угадывания данные накапливать дольше надо.
Вот такая простая скотина этот человек . Сложным натурам можно на 3 хода назад отслеживать, простым – на 2.
Так вот цепи Маркова – это цепи событий. Они используются в жизни таких вариантах:
* когда надо посчитать некое стационарное состояние (распределение) при наличии ограниченного набора событий. Например, перескоки электронов по энергетическим уровням. Или перескоки юзера по матрице ссылок при расчете PageRank: http://www.yandex.ru/yandsearch?text=цепи маркова pagerank&stype=www
* Или когда надо предсказать поведение системы на основе ее нынешнего состояния. Тут используется понятно какая гипотеза - что развитие ситуации определяется тем, как она развивалась раньше на N ходов. Например, тот же текст может быть описан как последовательность и по ней выбрано слово, появление которого в тексте «следующим ходом» наиболее вероятно.
Так вот про текст и говорим. Слов, однако, гораздо больше, чем 2 (ноль и единица), поэтому эффективно угадать следующее слово не выйдет. А неэффективно, но грамматически связно – пожалуйста! Это и есть генерация по цепям Маркова.
***
Вот несколько ссылок по теме:
Про PageRank: http://www.mediacraft.ru/sections/articles/1/2.html
На форуме SeoChase: http://www.seochase.com/viewtopic.php?t=2149
Про генерацию текстов: http://predpinimatel-cd.com.ru/book....ex2.htm (терминология там, правда, стремная)
***
Короче говоря, вероятности в случае генерации связного текста можно выбросить за ненадобностью… Алгоритм получается такой:
0) берем текст, разбиваем его по предложениям, а внутри каждого предложения выделяем последовательности из N (допустим, 2-х) слов и пишем в таблицу
1) Берем случайно одно из «первых» слов в предложении, и ставим эту пару как первую.
2) По второму слову в паре выбираем все те пары, в которых это слово идет первым и дополняем текст вторым словом
3) Идем к предыдущему пункту 2, не забывая иногда закрывать предложение (например, парами, которые встречаются в концах предложений)
Вот примерно так. Это дает грамматически связный текст в любых количествах. Для размножения можно использовать и вероятности появления той или иной последовательности, и увеличивать N, выбирая одно следующее слово по предыдущим N-1. И все цепочки слов (здесь: пары) встречаются в реальной жизни, а на пробивку по тройкам и N-кам слов никаких ресурсов у поисковика не хватит.
А как бороться с «дорвеями по цепям Маркова»?
А так, что основная цель дорвейщика – увеличить количество текста. И, взяв на вход 100-200 КБ (15-30 тыс. слов), получить на выходе огромную гору текста, разбитую по страницам.
Но свойство любого текста будет в том, что распределение тех же пар слов будет иметь длинный и тонкий хвост из редко (1 раз, например) используемых словосочетаний. Просто потому, что в русском языке слов – до фига. Даже словарный запас из 100 тыс. слов –больше, чем весь исходный для дорвейщика текст. И длина этого хвоста (ну, скажем, число пар, встречающихся в тексте 1 раз, поделенное на общее число пар) – будет измеряться в десятках процентов. А то и до 70-90%, чую, доходить будет. Ну это поверяется легко.
А поскольку лорвейщик текста нагенерил в 10-100 раз больше, чем был исходный текст, словосочетания там поюзаны многократно. Гораздо больше, чем 1 раз. Конечно, дорвейщик разбил текст по страницам, так что ловить надо в пределах сайта.
В принципе, даже ресурсов много не надо… Пробить по нескольким хорошим крупным сайтам свойства текстов. Прикинуть, например, сколько из 10 тыкнутых наугад пар слов встречаются на сайте более 1 раза. Допустим, 10-30%.
А у дорвейщика будет сильно больше 99%. Например, если дорвейщик из 100 Кб текста нагенерил 10 Мб, он каждое словосочетание использует где-то 100 раз. Ну и вероятность, что ты попадешь на уникальное в пределах сайта словосочетание – порядка 1%. А 99 будут неуникальных.
Ну и дальше сайт - ф топку. Т.е., звонок модератору.
взято тут http://www.umaxforum.com/topic/9/7303/
[0]
comments (2268 views) |
[0]
Trackbacks
[0]
Pingbacks
Реф-спамилка от читателя. Тестирование.
http://dw.wahack.org.ru/ref.php
1. Строго следовать инструкциям.
2. в кейвордах использовать ТОЛЬКО МАЛЕНЬКИЕ БУКВЫ И ПРОБЕЛЫ
3. Заливает только на народ.
4. Зарегить народовский хостинг надо ДО нажатия нижней кнопки :)
5. вроде все..
[2]
comments (2234 views) |
[0]
Trackbacks
[0]
Pingbacks
3D статистика

http://www.visitorville.com/
тут http://www.visitorville.com/flash-demos.html можно посмотреть демки ..
типа как посетителя пригнали на пожарной машине на сайт

как у него паспорт .. то бишь данные посмотрели

короче типа игрушки на свой сайт
[0]
comments (1875 views) |
[0]
Trackbacks
[0]
Pingbacks