Новые технологии уже в пути
Apr. 30th, 2009 02:36 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Яндекс-директ обкатывает новые технологии контекстно-зависимых показов рекламы. Справа от результатов поиска показал аж три объявления про продажу писсуаров. И это при том, что в этих результатах слово "писсуар" или там "поссать" не встречается.
Предполагаю, что они учатся читать мысли пользователя или, по крайней мере, считывать его физилогическое состояние, и соответственно подбирать темы рекламы. Пока что не очень получается, ссать мне не хочется. Но не все сразу, конечно.
хехе
ЗЫ: правда, в выдаче встречается слово "жопа". Но при чем тут писсуар? Они что, туда срут, что ли?
Предполагаю, что они учатся читать мысли пользователя или, по крайней мере, считывать его физилогическое состояние, и соответственно подбирать темы рекламы. Пока что не очень получается, ссать мне не хочется. Но не все сразу, конечно.
хехе
ЗЫ: правда, в выдаче встречается слово "жопа". Но при чем тут писсуар? Они что, туда срут, что ли?
no subject
Date: 2009-04-30 12:19 am (UTC)no subject
Date: 2009-04-30 05:06 am (UTC)no subject
Date: 2009-04-30 05:49 am (UTC)no subject
Date: 2009-05-02 02:10 pm (UTC)... Когда слова А и Б - синонимы? Не тогда, когда число соседства большое (даже если его нормировать по частоте встречаемости слов по отдельности). Такое всего лишь свидетельствует о том, что А часто стоит рядом с Б ("кофе" - "растворимый", "обжарить" - "лук", "бабы" - "дуры" и тп).
На самом деле А и Б синонимы, если их строки похожи с точностью до множителя. То есть это два N-мерных вектора, угол между которыми должен быть близок к нулю. Или, что то же самое, косинус этого угла должен быть близок к единице. А косинус - это скалярное произведение, деленное на длины этих векторов.
Пусть слов всего у нас N, разных соседей тоже примерно N (чуть меньше, т.к. некоторые слова мы исключили, но не намного). В каждой строке в среднем не так уж много ненулевых чисел (у слова "параллелограмм" гораздо меньше соседей, чем слов русского языка вообще). Обозначим это среднее число соседей M. Все длины всех векторов мы вычислим примерно за N*M действий, а вот вычисление всех скалярных произведений - уже очень вычислительно затратное действие, и занимает примерно N*N*M действий.
Вот тут на помощь и приходят сотни компьютеров и всякие sexy методики распараллеливания вроде MapReduce. ...
вкратце - между жопой и писсуаром угол небольшой
no subject
Date: 2009-05-02 08:42 pm (UTC)хехе