Русский язык - Справочно-информационный портал Вече - Живой журнал

Конференции

Конкурсы

Олимпиады

О портале

Вече

форумы | новая тема | начало | к началу | поиск | войти

назад | вперед

Живой журнал

Автор: Алексей Лапин
Дата: 08-12-05 23:53

Хочу донести до аудитории такую мысль:
Ныне модный ЖЖ - средство сбора информации о настроениях населения по всему более-менее цивилизованному миру.

1. Платформа, на которой всё это работает находится в Штатах и вполне может быть под крылом ЦРУ.
2. Современные технологии позволяют составлять частотный словарь ЖЖ "на лету".
3. Трафик ЖЖ огромен - это отличная выборка для языковой статистики.
4. Имея в руках частотные словари за каждый день, каждую неделю, каждый месяц можно при помощи несложных алгоритмов предсказывать революции, результаты выборов, тестировать рекламные слоганы, писать задевающие за живое тексты.
5. Про банальный поиск по ключевым словам я вообще молчу.

Интересны мнения по этому поводу...

Ответить на это сообщение

Re: Живой журнал

Автор: Тигра
Дата: 09-12-05 00:19

Угу. А за спиной США - жидо-масонский заговор.
Как приятно ощущать себя пешкой в чьих-то зловещих, могущественных и сверхъестественно умных руках...

Ответить на это сообщение

Re: Живой журнал

Автор: Oobiedoobie
Дата: 09-12-05 15:14

А что такое "жвиой журнал"? Извините...

Ответить на это сообщение

Re: Живой журнал

Автор: GalyaA
Дата: 09-12-05 15:24

См. http://www.livejournal.com/

Ответить на это сообщение

Re: Живой журнал

Автор: Oobiedoobie
Дата: 09-12-05 16:10

Ах вот оно что... Спаси бог Вас, уважаемая GalyaA ...

А я думал, что речь идет о каком-то обобщенном названии.

Интересно однако: что, собственно, можно вытянуть из livejournal с точки зрения модных настроений? По-моему, есть вирутальные площадки и для более интересных проектов.

Скажем, местный форум можно рассматривать в числе прочего и как накопитель профессиональных аргументов против традиционно жестких норм в русском языке. Траффик вполне приличный, а главное - прицельный. Почему бы тут чьим-то крылом рядом не прошуршать? :)) Ведь, как показывает опыт последних десятилетий, между развитием пиджин-рашн и рыночных отношений есть какая-то неуловимая связь.

Ответить на это сообщение

Re: Живой журнал

Автор: Тигра
Дата: 09-12-05 20:15

Блоги. Не обязательно LiveJournal, просто так уж в России стали называть блоги вообще, потому что ЖивойЖурнал наиболее развит. Чаще пишут просто ЖЖ.
Слово "блог" в России, кажется, не прижилось. Его знают, но мои, например, друзья им не пользуются вообще.

Ответить на это сообщение

Re: Живой журнал

Автор: Dmitry
Дата: 10-12-05 01:02

Во-первых. Вполне возможно, что таким образом можно следить за настроениями в обществе. Но ведь есть же и те, кто излагает свои мысли не в Ж. Ж., а на своих собственных сайтах. Поэтому лучше для таких целей следить за ВСЕМ интернетом, а не только за Ж. Ж.

Во-вторых, ПРИ ЧЕМ ТУТ ЯЗЫКОЗНАНИЕ????

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 10-12-05 14:12

1. За всем интернетом следить невозможно. Например, червяк поисковой системы обходит проиндексированную часть примерно за неделю. А ещё нужно сравнить старый и новый индексы. Сеть - слишком разветвлённая штука. Сканировать всю сеть столь трудоёмкая задача, что на лету результатов не получить. Только с 1-2 недельным отставанием и с таким же времянным разрешением. Что бы узнать вкус супа не надо есть его весь, достаточно одной ложки после хорошего перемешивания.

ЖЖ пиарится как площадка для оперативной информации. Туда она и стекается. Вся информация идёт в один центр. Каждое изменение не надо ловить. Оно само о себе сообщает и запускает соответствующий процесс. Только так можно делать экспресс-анализ за один день и даже час.

2. Для сбора данных используются технологии языкознания.

Ответить на это сообщение

Re: Живой журнал

Автор: Dmitry.
Дата: 11-12-05 14:29

1. Правильно, весь суп кушать не надо потому, что выборка---одна ложка его---будет репрезентативною. Но я отнюдь не считаю репрезентативною выборку---Ж.Ж. Как Ж.Ж. может представлять мысли всех пользователей интернетом, когда большинство крамольных идей публикуются на особых сайтах; революционеры также не будут пользоваться Ж.Ж. Черпать сведенья об общественном мнении можно и на площадях, однако ж никто не станет утверждать, что площади устроены как раз для таких целей! По-моему, предсказывать войны и революции по Ж.Ж. можно с таким же успехом, как прежде это можно было делать по салонам и площадям---там обыватели говорят о том, что уже до них продумано и предсказано. Крамольщики прежде не ходили в салоны, также как и теперь не пойдут в Ж.Ж.

2. До появленья компьютеров полицейские соглядали глазами переписку и слушали ушами речь. Это тоже затрагивает вопросы языкознания?!

Ответить на это сообщение

P. S. Re: Живой журнал

Автор: Dmitry.
Дата: 11-12-05 14:34

P. S. Ведь чтобы узнать, что такое пишут и про что говорят, надо владеть языками и жаргонами!

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 11-12-05 17:45

1. ЖЖ не майдан Незалежности, а кухня, на которой говорят каждый день. Потому то эта выборка и столь удачна.

2. До компьютеров на анализе подслушенного и подсмотренного сидели армии аналитиков. Они извлекали информацию из тонн всякой шелухи. Сейчас живые аналитаки наверняка тоже следят за лентой. Но теперь появились новые возможности автоматической обработки. Она даёт гораздо более оперативную информацию. Здесь работают статистические и лингвистические методы.
Скорее всего на АРМ языковеда в штатском поступает лента ЖЖ на конкретном языке или из выбранного региона или от выбранной группы пользователей. Кроме обычной информации в ней добавляется специальная разметка. Например цветом выделяются слова, которые стали чаще встречатся в последнее время. Оператор может ставить флажки на слова, фразы, сообщения. Ну и так далее...
... на выходе - кривые человеческих эмоций в среднем по выборке. Примерно так я себе это представляю.

Ответить на это сообщение

Re: Живой журнал

Автор: Dmitry.
Дата: 11-12-05 20:29

Вы, pardon, как студент из анекдота, там, где надо говорить про собак, вы говорите про блох. Конечно, блохи и собаки связаны, но так пусть он бы и говорил про собак и коротко---про блох. Говорите про лингвистику, а вы---про соглядатайство.

Ответить на это сообщение

Re: Живой журнал

Автор: Сергей Г.
Дата: 11-12-05 20:47

>>>>ЖЖ не майдан Незалежности

Уважаемый Алексей, на этом Форуме для нецензурных слов есть рубрика "Арго".

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 11-12-05 20:48

Ха, ха! Совсем не про собак, а про рыб...

Один студент знал только про блох.
А билет ему достался про рыб.
Вот он и говорит: "у рыбы чишуя, а если бы была шерсть, то в ней водились бы блохи". И дальше пошёл шпарить про блох :-)))

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 11-12-05 20:50

Не понял, а какое из них нецензурное?

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 11-12-05 20:59

А я и рассказываю про лингвистические технологии и их приложение в современном мире. Разве не интересно? Мне например очень. Может кто скажет то, о чём я не знаю. Уметь писать тексты, берущие за душу тоже очень хочется...
В хозяйстве и ржавый пулемёт сгодится.

Ответить на это сообщение

Re: Живой журнал

Автор: Dmitry.
Дата: 11-12-05 22:48

В билете два вопроса, первый---про собак, а про рыб---второй.

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 12-12-05 09:38

Ну уж дотравливайте до конца, при чём тут собаки?..

Ответить на это сообщение

О господи, - опять ламер-идеалист :((

Автор: Р. Г.
Дата: 12-12-05 09:56

Извините за грубость, но представляете Вы "это" себе именно как ламер-идеалист, энтузиаст научного прогресса от околонаучной фантастики, в духе памятных читателей советских журналов (неживых:)...) "Техника молодёжи" и "Юный техник".

Аналитическое ПО подобного типа давным-давно существует, причём ему в принципе всё равно, что анализировать: статистику продаж, разводов или частоту СМС-ок. Вот только чтобы это всё работало, нужны ФАНТАСТИЧЕСКИЕ мощности по обработки информации, а чтобы работало быстро (Вы же говорите о _часах_! Хи-хи:((...) - ещё более фантастические сетевые мощности. Всё же вместе стОит фантастических денег. А на выходе чаще всего даёт тривиальные результаты, которые и так очевидны, либо могут быть получены без особых затрат "методом пристального взгляда" более-менее опытного эксперта.

Наконец, простите, а кому нужно такое бешеное быстродействие? Кто за него заплатит, за анализ "настроений часа", да ещё по группам и регионам ? Кто успеет эту инфу использовать? Всем мыслимым потребителям за глаза достаточно куда менее тщательного анализа - у них просто скорость принятия решений - месяцы и годы....

(Сравните с прогнозом погоды - задача тоже примерно та же. Сеть метеостанций глобальная, спутников куча, суперкомпы... и "метеоролог ошибается один раз. Зато - каждый день"(с).... Хоть бы катастрофы не пропускали...)

Так что будьте спокойны: Вашу информационнную безопасность надёжно защищает "эффект неуловимого Джона": техническая возможность прослушивать всё и всех существует уже минимум полвека, но реализована она не будет никогда. Типа как полёт человека на Марс на ракете:)...

Ответить на это сообщение

Re: О господи, - опять ламер-идеалист :((

Автор: Алексей Лапин
Дата: 12-12-05 10:29

Я вовсе не энтузиаст и не юный техник.

Что аналитическое ПО существует почти не сомневаюсь.

Мощности: видимая пользователям часть ЖЖ работает почти без сбоев. Каналы связи используются распределённые, а вычислительные мощности сосредоточены. Я думаю, что повысив эти мощности в 2-3 раза вполне можно всё спец-ПО обеспечить.

Быстродействие вполне пригодится (см. теорему Котельникова). Не все решения проходят через парламент. Есть и другие, быстрые пути.

Пример анализа "настроений часа": отклик на новости или рекламу по ТВ.

Стоит всё это весьма недёшево. Кто за это платит, явно не рекламодатель, на ЖЖ нет рекламы. Пользователи тоже ничего не платят, кроме немногих с платными акаунтами (я пока ни одного такого не встречал).
Кто то ведь должен платить... Логично предположить что это разведка или рекламщики. И тем и другим такие штуки могут дать новые, грандиозные возможности. И те и другие - небедные.

А про погоду.
В Москве сегодня к вечеру будет около нуля. Завтра - то же самое. В среду похолодает примерно до -5. Дальше немного потеплеет. И всё время снег, иногда с дождём.

Ответить на это сообщение

Re: О господи, - опять ламер-идеалист :((

Автор: Р. Г.
Дата: 12-12-05 15:45

Алексей Лапин сказал:

> Пример анализа "настроений часа": отклик на новости или
> рекламу по ТВ.

1) Кому он нужен - в течение часа?
2) А Вы уверены, что он попросту успеет сформироваться? (До жирафа ещё не дошло, а Вы его уже анализируете:)...)

> Кто то ведь должен платить... Логично предположить что это
> разведка или рекламщики.

Это по которой из логик логично?

>И тем и другим такие штуки могут
> дать новые, грандиозные возможности. И те и другие - небедные.

Зачем им новые возможности, когда они старые "съесть" не могут? Вам слово CОРM чего-нибудь говорит? А его эффект Вы на себе заметили? То-то... А это ведь капля в море их возможностей... И у них, и в науке, проблема давно уже не в недостатке информации, а в её ИЗБЫТКЕ, в завале ... Осмыслять не успеваем - а тут комп - слабый помощник, увы :(... Неуловимый Джон непобедим:).

> А про погоду.
> В Москве сегодня к вечеру будет около нуля. Завтра - то же
> самое. В среду похолодает примерно до -5. Дальше немного
> потеплеет. И всё время снег, иногда с дождём.

А Вы не заметили, что весь абзац лишён смысла? Погоды в Москве с ТАКОЙ точностью нет в природе, т.к. Москва - это территория минимум 40х40 км, разброс плюс-минус 5-10 градусов по ней - обычное дело (бывает и 25).

Ну, а что там будет в среду - поживемо - побачимо. "Точный прогноз на завтра Вы узнаете послезавтра." :)...)

Вот так и с "настроением часа": какие-то градусы система выдаст, да вот их отношение к реальности будет... как в прогнозе погоды :)...

>Что аналитическое ПО существует почти не сомневаюсь.

Не только существует, но и активно продаётся. Вот только решает оно ограниченный (заранее разработанный разработчиками, годами) набор задач (вся метеорология решает одну матзадачу, всегда только одну...) - или выдаёт кучу очень красивых, но совершенно сырых данных, в которых вы должны _угадать_ нечто. Когда оно, ПО, сможет что-то большее (реально самообучаться, например) - это и будет уже не "искусственный интеллект", а настоящий машиный разум. Как думаете, скоро ли машина сможет мыслить? ;)

Ответить на это сообщение

ваал-шпион

Автор: Russofeel...
Дата: 12-12-05 18:12

была как-то программа ваал. была и шпионская версия, которая позволяла делать всё то, чего опасается тов. Лапин. но, кажись, она сдохла. во всяком случае про ее разработчиков давно не слышно.

Ответить на это сообщение

Re: Живой журнал

Автор: minka
Дата: 12-12-05 20:16

Алексей Лапин сказал:
>
> Хочу донести до аудитории такую мысль:
> Ныне модный ЖЖ - средство сбора информации о настроениях
> населения по всему более-менее цивилизованному миру.

Ну и что, пусть себе собирают, мне не жалко. Я даже не имею ничего против подслушивания моих телефонных разговоров всяческими спецслужбами, лишь бы жене не доносили, если буду говорить с любовницей :-). Надеюсь, спецслужбам не до того? А вот если они (спецслужбы), благодаря подслушиванию, предотвратят террористический акт, то я им только благодарен буду.

Ответить на это сообщение

Re: О господи, - опять ламер-идеалист :((

Автор: Алексей Лапин
Дата: 12-12-05 21:15

> 1) Кому он нужен - в течение часа?
> 2) А Вы уверены, что он попросту успеет сформироваться? (До жирафа ещё не дошло, а Вы его уже анализируете:)...)
Если сообщение задело за живое - характерные слова из него обязательно будут пробиваться в речь и в ЖЖ. Это мимо сознания. Не "Ариэль" пролезет а "обычный". И это можно отследить. И учесть в рекламной компании.

> Это по которой из логик логично?
А по той, по которой надо искать кому выгодно и у кого есть возможности.

> Зачем им новые возможности, когда они старые "съесть" не могут? Вам слово CОРM чего-нибудь говорит? А его эффект Вы на себе заметили? То-то... А это ведь капля в море их возможностей... И у них, и в науке, проблема давно уже не в недостатке информации, а в её ИЗБЫТКЕ, в завале ... Осмыслять не успеваем - а тут комп - слабый помощник, увы :(... Неуловимый Джон непобедим:).
На СОРМ меня аж 2 ассоциации (одна буквальная).
Информация всегда распределена неравномерно. Про блох - навалом, а про рыб - маловато будет...

> А Вы не заметили, что весь абзац лишён смысла? Погоды в Москве с ТАКОЙ точностью нет в природе, т.к. Москва - это территория минимум 40х40 км, разброс плюс-минус 5-10 градусов по ней - обычное дело (бывает и 25).
А я точно и не писал. Разброс по Москве градуса 3, не больше. Мой прогноз привязан к Северному округу.

> Ну, а что там будет в среду - поживемо - побачимо. "Точный прогноз на завтра Вы узнаете послезавтра." :)...)
;-)

> Вот так и с "настроением часа": какие-то градусы система выдаст, да вот их отношение к реальности будет... как в прогнозе погоды :)...
В рекламе очень важный параметр - сколько народу её заметило. Полярность реакции вторична. В описанной системе можно это мерить весьма эффективно.

> Не только существует, но и активно продаётся. Вот только решает оно ограниченный (заранее разработанный разработчиками, годами) набор задач (вся метеорология решает одну матзадачу, всегда только одну...) - или выдаёт кучу очень красивых, но совершенно сырых данных, в которых вы должны _угадать_ нечто. Когда оно, ПО, сможет что-то большее (реально самообучаться, например) - это и будет уже не "искусственный интеллект", а настоящий машиный разум. Как думаете, скоро ли машина сможет мыслить? ;)
То что продаётся - совсем не тот продукт.
Искусственный интеллект - не способность мыслить. Прежде всего это способность распознавать образы. Не только зрительные, но и речевые. Распознав образ любой интеллект, хоть искуственный, хоть самый натуральный действует по несложной схеме, реализация которой не составляет проблемы.
Пример: некто пошёл на охоту на крокодилов. Вот ищет он их по Африке, вглядывается в мутную воду Нила и прибрежные заросли. Все чувства обострены, ушки на макушке... Нашёл! Дальше руки уже всё сами делают, почти без участия мозга: "клац, клац, бабах!" и всё :-)

Ответить на это сообщение

Re: ваал-шпион

Автор: Алексей Лапин
Дата: 12-12-05 21:19

Вот помнится в начале 20 века по проблеме расщепления ядра атома была масса публикаций, а года после 35-го - как отрезало.

Ответить на это сообщение

Re: Живой журнал

Автор: Алексей Лапин
Дата: 12-12-05 21:23

Жене доносить не будут. Это демаскирует всю систему.

Ха, вот написал и понял, что пролезло таки словечко. Это я сегодня "Авиационно-космическое обозрение" читал ;-)
Правда, оно само пролезло. Я даже и не думал...

Ответить на это сообщение

Re: ваал-шпион

Автор: Р. Г.
Дата: 13-12-05 10:29

Да куча была таких программ, и в докомпьютерное время, и после. Толку от них большого не было.
Причин много, одна из самых очевидных и непреодолимых: от них всех элементарно защищает "ломаный язык". Этим ещё партизаны в Отечественную пользовались, сбивая с толку немецкую радиопрослушку: "феню" или областной выговор всякой деревни рядовые немецкие переводчики не вытягивали. Так же и в инете: вот сейчас "падонки" пишут в те же ЖЖ, через полгода будет другая мода, и т.д. - никакая автоматичекая система распознавания не угонится, а человек - элементарно....
(На эту тему, кстати, был рассказ у новопреставленого Шекли...)

Проблема пока столь же вечно неразрешима, как прогноз погоды :)))

Ответить на это сообщение

Будут, будут :(...

Автор: Р. Г.
Дата: 13-12-05 11:07

Алексей Лапин сказал:
>
> Жене доносить не будут. Это демаскирует всю систему.
>

Зато принесёт конкретные бабки конкретному человеку. Которому чихать на систему: поглядите вокруг, на каждом углу продаются базы данных: ЦБ, МТС, ГАИ.... налоговая....

Ответить на это сообщение

форумы | свернуть | начало | к началу

назад | вперед