Грамота.Ру
ГРАМОТА СЛОВАРИ СПРАВКА НАВИГАТОР КЛАСС ИГРА Версия для мобильных устройств
Конференции Новости Журнал Конкурсы Олимпиады Форум Поиск О портале


Вече
 форумы  |  новая тема  |  начало  |  к началу  |  поиск  |  войти   назад  |  вперед 
 речевые полиграфы
Автор: Юлия Зайцева 
Дата:   14-01-02 16:39

Народ! Помогите, пожалуйста, найти какую-нибудь информацию об эксперимнтах с речевыми полиграфами или речевыми измерителями эмоционального стресса (типа "Марк-1" и т.п.) Может, кто какие линки знает?..

Ответить на это сообщение
 
 полиграф как детектор правды
Автор: Психолингвист 
Дата:   21-01-02 23:04

Одним из современных средств распознавания лжи является полиграф, или детектор лжи (lie detector, или, что более корректно, детектор правды – truth detector). Характерно, что в основу конструирования полиграфа легли именно исследования в области психолингвистики.
Измеряя степень смысловой близости слов в сознании человека, отечественные исследователи А.Р.Лурия и О.С.Виноградова, по сути дела изобрели новую методику, основанную на методике ассоциативного эксперимента. Они изучали особенности сосудистых рефлексов человека. При этом было выделено три типа реакции на раздражение (слабым разрядом электрического тока), а именно: нейтральная, ориентировочная и защитная.

и так далее.
(из неопубликованного)

а если серьезно, то неужели в инете есть такое (знаю про телефонные приставки), а вот есть ли онлайновое определение стресса??
(если кто возьмет на себя техническую строну - возьму психо-лингвистическую).

Ответить на это сообщение
 
 Re: полиграф как детектор эмоциональных реакций...
Автор: Юлия Зайцева 
Дата:   22-01-02 11:36

... а не правды или лжи. Всю работу делает оператор. :)
Насколько я помню, метод семантического радикала при работе с полиграфами не использовался. Или использовался?..
В и-нете, слава богу, такого нет и пока быть не может, потому что основными параметрами, измеряемыми речевым полиграфом, являются инфразвуковая область речевого сигнала в диапазоне 5-25 Гц, частота основного тона и т.п. Помимо этого большую информативную ценность представляют: длительность пауз между словами, особенности произношения ударных гласных и ещё ряд показателей, о которых мне бы хотелось узнать подробнее.
Эксперименты по созданию речевого полиграфа с треском провалились и были прекращены в России и в США как бесперспективные (В.А.Варламов, Г.В. Варламов. Психофизиология полиграфных проверок. Кр.-2000). Недавно израильтяне заявили, что создали принципиально новую конструкцию, которая работает лучше, но подробностей не публиковали.

Уважаемый Психолингвист, если у Вас есть идеи по созданию речевого или текстового полиграфа, с удовольствием возьму на себя программное обеспечение.

Ответить на это сообщение
 
 трастер
Автор: Психолингвист 
Дата:   22-01-02 18:06

"трастер" дорогая штука (под 4 тыщи зеленых). я однажды пытался продать, так не поверили, что он действительно израильский. сказали, что в Одессе делают. так и остался где-то лежать непроданный :)
да и сам я из хелпа не очень понял про него. мудрёно.
а) семантический дифференциал а не радикал
б) оператор все больше на тремор рук смотрит. а грфики для красивости больше.
в) ультразвук можно замерить на компе (думаю)
г) и паузы мне до 5 знака после запятой замеряли (тоже на компе)
д) если Кр.-2000 это краснодар, то я буду сомневаться долго.
е) детекторы есть и работают. и данные учитываются. не провалилось ничего.
ж) пару лет назад про телефонный детектор говорили. недорогой не то 100, не то 300 ам. дол. подключается к телефону иесли говорящий говорит, волнуясь, то это отмечается.
з) вопрос, кто будет в онлайне кого тестировать на ложь.сам себя? записи в МР-3 большой объем занимают. пока загрузишь, пока просчитаешь, час уйдет.
и) текстовый полиграф? отличная идея. начал задумываться. надо поговорить с Экманом, вдруг уже сделали?
к) может речевым синтезатором займемся? человек пишет слово, а комп ему человечьим голосом его читает. игрушка, а забавная.(видел и слышал и слушал).
л) откуда у вас столько мыслей в голове? вы -- умная.

Ответить на это сообщение
 
 ух ты!!!
Автор: Юлия Зайцева 
Дата:   23-01-02 23:15

Ну, пожалуйста, пришлите хелп на трастер почитать, а? А я Вам за это в нём разберусь...:)
а) не поленилаcь, спросила у Яндекса (http://skeptik.dp.ua/lib/psixo/metod.htm ); радикал всё таки. дифференциал тоже есть, но его американец изобрёл. Кстати, интересно, не пытались ли применять подобные методы ко всяким неадекватным типам, которых на полиграфе не проверишь?
б) не обижайте операторов, копаются они в этих графиках как проклятые, а для тремора уже датчики придумали (их под ножки стула подкладывают); правда, показатели тремора считают не особо информативными: мудрёные больно. И вообще, за такую зарплату, как у этих томных дамочек в погонах, иных бы и самих тремор хватил :)
в) можно, но прибор нужен.
г) паузы-то запросто.
д) а менты на этот Краснодар молятся: школа, мол, у них; а книжку эту, которая Кр.-2000, за библию почитают.
е) здорово! а в МВД говорят, что это всё туфта да бирюльки…
ж) они, поди, просто диапазоны акустические мерили, поэтому и стоит дёшево.
з) что-то меня сомнения гложут насчёт MP3: он же упаковывает с определённым тактом, информация-то теряется…
и) а это ДЕЙСТВИТЕЛЬНО возможно??!!! вот так ляпнешь от балды….: ) хотя были же всякие исследования… ух, написать бы такую программку, да знаний предмета не хватает. кстати, эмвэдэшных психологов чертовски сильно интересуют эти штуки (оперативный анализ показаний, кадровые дела всякие). но это уже не для форума…
к) игрушечка прикольная, но там, по-моему, уже всё сделано. столько их всяких разных налепили, что уже неинтересно. и никому-то они не пригодились...
л) количество мыслей в голове критерием ума не является (со слюнявой улыбкой идиотки), а качество их оставляет желать лучшего. но как чертовски приятно слушать комплименты! :) спасибо.

Ответить на это сообщение
 
 текстовый полиграф
Автор: Психолингвист 
Дата:   26-01-02 04:14

пока ищу про тестер вот что подумал.
фраза "король франции лыс" не может быть верифицирована как истинная или ложная по той причине, что король франции имеет шевелюру. (щютка)
это я к тому, что проверка на истинность текста без обращения к реальности невозможна. или есть такие ограничения. которые сегодня считаются непреодолимыми. проверить 2+2=5 еще можно, а "фильм "Властелин кольца" был действительно интересный" нельзя, если не ввести правильное название фильма и критерий интересности. короче прагматика ограничивает.... увы....
другое дела - показатели неискренности, преувеличения или преуменьшения. но опять-таки по отношению к норме. и так далее. слегка замкнутый круг.

а что насчет Элизы скажите?
"Одним из самых известных примеров подобной системы является программа «Элиза», общение с которой моделирует общение с психотерапевтом. Одна из модификаций этой программы PC Friend Eccliza может представляться, повторять вопросы, требуя уточнений, просит сменить тему, если она не может ее продолжить, задает ироничные вопросы, чем очень напоминает поведение человека".
(тоже из неопубликованного).
тест на интеллект :)

Ответить на это сообщение
 
 мне тоже лавры Тьюринга покоя не дают :)
Автор: Юлия Зайцева 
Дата:   27-01-02 01:25

Да, Элиза – это интересно. Хрестоматийная штучка, хотя и не самая сложная из экспертных систем. Где-то у меня даже её листинг завалялся.
На русском языке такую программу написать сложнее, чем на английском. Из-за падежей. Но в целом реально. Интересно, использовли ли когда-нибудь разработчики подобных программ анализ эмоциональной окраски реплик собеседника? Обязательно покопаюсь в литературе и выясню. Если нет, то есть шанс их умыть. Составить словарик...даже можно дёрнуть его откуда-нибудь... семантические примитивы всякие выделить, эмоционально окрашенные словечки пометить... Хотя работа эта, конечно, долгая и нудная... Кстати, вы в курсе, что Лебнеровскую премию в размере 100 000 $, назначенную разработчику программы, прошедшей тест Тьюринга, ещё никто не получил? :)
А по поводу истинности текста... Так ведь и полиграф никакой истинности не устанавливает. Только эмоциональные реакции и всё. Правда, оператор всегда задаёт серию «калибровочных» вопросов, которые определяют «фон», т.е. норму для данного индивида в данный момент. А с текстом это вряд ли возможно... Но всё равно, полагаю, из текста при должном подходе можно вытрясти значительно больше, чем это делается работниками следственных органов.

Кстати, фраза "король франции лыс" может быть верифицирована как ложная даже при условии, что во Франции нет короля :)

Ответить на это сообщение
 
 король франции
Автор: Психолингвист 
Дата:   27-01-02 22:02

и почему же фраза про лысого короля Франции ложная?
если не вы не закладывали энциклопедических знаний, то не определить.
а энциклопедические знания меняются быстро.
король Афганистана носит бороду. (так? он оказывается жив. вот не знал)
король Болгарии принял участие в выборах. (победил ли?)
королева Англии заболела грипом. (или просто простудилась?)
принц англии принимает наркотики (или просто попробовал?)
Властелин колец к концу года будет иметь уже третью серию. (или вторую?)
и так далее.
нет тут эмоций, нет тремора.
кстати, чаты не очень эмоциональны. просто обзываются все и посылают. а эмоций особых нет.

в Лебнеровскую премию поподробнее можно? а то за интернет надо платить... :)

Ответить на это сообщение
 
 Re: король франции
Автор: Юлия Зайцева 
Дата:   28-01-02 18:17

Фраза про лысого короля Франции не просто ложная, а ложная ПРИ УСЛОВИИ, что во Франции нет короля. Имеется запрос: истинно ли свойство ЛЫСОСТЬ объекта КОРОЛЬ ФРАНЦИИ? Имеется условие: объект КОРОЛЬ ФРАНЦИИ не существует. Если в логическую систему не введено понятие неопределённости, то всем свойствам несуществующего объекта, в т.ч. ЛЫСОСТИ, ВОЛОСАТОСТИ и ЭЛЕКТРОПРОВОДНОСТИ, присвавается значение «ложь». То же самое относится к любым свойствам объектов, не сущестующих в данной системе. Хотя в других системах они могут существовать и иметь свойства. Вот такой эмпириокритицизм :)Но это уже из области программирования.
В приведённых Вами текстах, конечно, нет никаких эмоций, и из них ничего не вытрясти. Но если взять расшифровку аудиозаписи объяснений дегенерата, подозреваемого в гоп-стопе, то там бывает столько эмоций всяких, что хоть святых выноси. Если он куражится, ноет и неизвестно, виновен он или нет, то, возможно, анализ его монологов на неискренность, шизоидность и т.д. как-то поможет делу. Правда, есть более простые и надёжные методы...
Лебнеровская премия была учреждена неким Лебнером (единственное, что я о нём знаю - это то, что он боролся за легализацию проституции :) в 1990 г. и предназначена тому, чья программа пройдёт тест Тьюринга. Тест Тьюринга заключается в следующем. Участвуют: А – мужчина, изображающий женщину; В - женщина, изображающая женщину; С – человек, который должен, ведя диалоги тип чата с А и B, определить истинный пол обоих. При этом А и B стремятся заставить С определить себя как женщин. Партнёры периодически меняются, пока не наберётся статистика ошибок С в определении пола А. Потом А заменяет машина. Тест считается пройденным, если после замены статистика ошибок не ухудшится.
Кстати, уж раз зашёл такой разговор, не порекомендуете ли какую-нибудь литературку по психолингвистике применительно к искусственному интеллекту?

Ответить на это сообщение
 
 Re: литературка
Автор: Психолингвист 
Дата:   29-01-02 20:08

В свое время слово "Литературка" было названием газеты "Литературная газета".
Тема архиобширная.
"Проблема автоматического анализа текста не входит в число сугубо психолингвистических, однако она не может быть решена без учета тех знаний, которые накоплены в психолингвистике. Не рассматривая эту проблему в целом, отметим лишь следующее.
В конце XX века количество электронных текстов и документов, существующих только в компьютерном виде, возросло многократно. Это потребовало развития технологий, связанных с обработкой данных. Обработка документов, созданных на естественном языке (по стечению обстоятельств эта аббревиатура тоже NLP – natural language processing) - это новые технологии, которые помогают нам использовать эти тексты и легко находить и обрабатывать документы.
.... дальше несколько абзацев про Элизу ...
Данная тема настолько широка, что мы отошлем читателей к специальным работам, многие из которых имеют исключительно прикладной характер".
(из неопубликованного). (пока)
попробуйте задать это НЛП в гоогле и вылезет немеренно.
Поэтому: советую идти от задачи. Для этого нужна ее четкая постановка.
Иначе можно утонуть в "литературке". Пока я не вижу ее (постановки задачи). Слишком широко. Надо сузить.
сорри, если резко. но так тоже иногда лучше.
З.Ы. за разъяснения спасибо. учту при переиздании.

Ответить на это сообщение
 
 Re: sic transit...
Автор: Юлия Зайцева 
Дата:   31-01-02 11:26

Да, лет десять назад мне бы и в голову не пришло называть литературкой что-то кроме газеты. А теперь даже и не ассоциируется...:)

Ох, не вовремя Вы кавычки закрыли (из неопубликованного :) Отошлите меня, пожалуйста, тоже "к специальным работам, многие из которых имеют исключительно прикладной характер"! Особенно к тем многим. Просто нигде почему-то не нашла никаких отчётов психолингвистов о работе с ИИ-системами. Может, искала плохо... И на НЛП - миллион ссылок, но только НЛП не то.
Что касается постановки задачи, так ведь в моей профессии именно на это больше всего времени уходит. А перед тем как её ставить нужно знать, что уже сделано, а что нет, чтоб велосипед не изобретать. Вот я и рою где ещё не рыто. Подход трудоёмкий, но действует.
А может чёрт с ними, с системами экспертными, а? Давайте напишем программу, которая стихи сочиняет. Я когда-то простенькую слепила и подсунула результат её работы подружке, которая в литературном училась. Вы не поверите, но когда она показала этот бред своему преподавателю, он очень её хвалил за нестандартность мышления :)

Ответить на это сообщение
 
 нестандартность мышления
Автор: Психолингвист 
Дата:   31-01-02 17:33

Стихи сочинят есть программа "Пушкин" - пришлю. 900 кило выдержит Ваш яахуу? Вот только стихи популярностью не пользуются. Поэтому "корысти" в создании такой программы не уматриваю.
попробуйте сконцентрироваться.
nuance создает программы такого плана: вы пишите слово. а оно его зачитывает. есть и наоборот. Горыныч русский пишет с голоса.
Возвращаясь к началу нити, скажу.
Программа отлавливания эмоций в речи может быть для чего нужна? "Определите свой уровень стресса по своему тексту". Написали письмо, пришлите нам и мы скажем, насколько вы возбуждены. (А то сами не знаете?)
Можно заложить туда слова, характерные для речи в сост. эмоц. напряженности. или из ИСС (изменнного состояния сознания). но это на нервных расчитано. а они порой неимущие. потому как нервные.
Надо искать универсальные программы, которые нужны многим. По-моему, программа типа Элизы хороша будет для любителей чата. в Германии уже вводят плату за чат (маленькую 3 евро в месяц). можно попробовать и тут. Минута - цент. И чаться (на пикантную тему) с Элизой (с Секслизой?).
Я это к тому, что постановочную задачу надо ставить с целью получения отдачи. А иначе работать - работать в ящик (компьютерный, который поглотит любой талант, который у Вас, несомненно просматривается :)
Даю установку: сконцентрируйтесь.

Ответить на это сообщение
 
 Реплика со стороны
Автор: Ирина 
Дата:   31-01-02 18:50

Многочисленные пардоны за то, что вклиниваюсь в дискуссию, но делаю это исключительно из опасения, что вы сочтете вашу переписку неинтересной для почтеннейшей публики и решите перенести ее (переписку) с форума в почту или куда-нибудь еще. Не делайте этого, пожалуйста! Очень интересно вас читать, хотя (или "именно потому что") не имею никакого отношения ни к психолингвистике, ни к программированию. Не лишайте нас удовольствия присутствовать при вашем диалоге...

Ответить на это сообщение
 
 Re: концентрируюсь...
Автор: Юлия Зайцева 
Дата:   01-02-02 12:00

Мой Яху Пушкина выдержит. Он и не такое выдерживал :) Пришлите, пожалуйста. А я на эту программу посмотрю и напишу что-нибудь получше. Люблю работать в ящик: то ли жизнь слишком сытая, то ли чего-то этакого не хватает :)
А если бы за развлекательные экспертные системы платили, то фигушки бы я ковырялась с корпоративными комплексами. Я бы тогда сейчас утрамбовывала чемоданы в багажнике серебристо-зелёного "Линкольна", чтобы отвалить на недельку в Австралию чесать за ухом кенгуров :) За интернетовские забавы в России население тоже не платит. Это не предположение. Это факт. Так что единственное коммерческое воплощение сетевого проекта - это уютный сайтик под крылышком богатого спонсора, каковым лично я не располагаю.
Остаётся то, за что, ВОЗМОЖНО, платить будут.
Установка принята. Концентрируюсь. Дух Винера, явись! :)
Поскольку это говорю не я, а дух основоположника, всё нижеизложенное может оказаться бредом.
1. Генератор рекламных текстов (с элементами "не того" НЛП и т.д.) Программируемо частично. Работа долгая и нудная.
2. Электронный дневник. С анализом эмоционального состояния клиента, психологическими тестами и выдачей рекомендаций. Если учесть сверхъестественную популярность ICQ'шного "дневника", идея - на первый взгляд - перспективная. Программированию поддаётся. Работа долгая, средней нудности.
3. Действительно, написать какую-нибудь Секслизу (хи-хи) индивидуального пользования с порнографичесими картинками. За порнуху-то всегда платили. При бедности русского любовного лексикона труда это большого не составит. В конце концов, ведь покупает же кто-то резиновых баб!
4. Поболтав с психологами из МВД, выяснить, что им нужно, написать это и, возможно, срубить гешефт, которого, возможно, хватит на то, чтобы обмыть завершение проекта в недорогом кабаке. Зато это может помочь кому-то делать что-то полезное. Патриотично.

Что Вы обо всём этом думаете?

P.S. Спасибо за комплимент. Постараюсь соответствовать :)

Ответить на это сообщение
 
 Re: Присоединяйтесь!
Автор: Юлия Зайцева 
Дата:   01-02-02 12:02

Ирина, спасибо за поддержку. А то мне уже казалось, что я начинаю бредить :)
Может, у Вас тоже какие-нибудь идеи есть? Если интересно, присоединяйтесь!

Ответить на это сообщение
 
 Спасибо, не рискну...
Автор: Ирина 
Дата:   01-02-02 14:02

Я, к сожалению, пригодиться вам могу только в виде благодарного слушателя (читателя), эдакой "молчаливой галлюцинации". К обсуждаемой вами теме я не имею никакого отношения, мне это интересно с точки зрения "вот что еще бывает в мире" - да и вообще приятно послушать умный разговор. Кроме того, генерировать идеи я не приспособлена, из триады "генератор идей - эрудит - критик" мне ближе две последние ипостаси, причем третья - в несколько большей степени. Но даже и в этих ипостасях я вам вряд ли смогу чем-то послужить: по природе я филолог (чего вам и без меня хватает), по профессии я переводчик (что вам не пригодится), по нынешнему занятию - корректор (тут вы тоже без меня спокойно обойдетесь), а мои тихие занятия теорией мифологии и историей литературы вам тоже, видимо, не понадобятся. А вот послушать вас мне оч-ч-чень интересно, спасибо.

Ответить на это сообщение
 
 Re: ....
Автор: Юлия Зайцева 
Дата:   01-02-02 15:19

...чем больше думаю, тем больше мне нравится Ваша идея с Секслизой...:)

Ответить на это сообщение
 
 Серебристо-зелёный "Линкольн"
Автор: Психолингвист 
Дата:   03-02-02 02:22

Юлия, поблагодарите себя за концентрацию. Уже начинает получаться.
Теперь о деле.
Есть сайт, продающий полицейские (police) машины в таксопарки или в личное пользование. Он очень скромный по замыслу создателя для того, чтобы не отвлекать человека от серьёзного дела. Но этот же человек, который создал сайт, может быть заинтересован в создании такой "говорилки", когда посетитель заходит и видит девушку-полицейскую (естесснно в мини-юбке с макси-попкой) и он может захотеть поговорить с ней. Тут
а) обозримый подъязык
б) суженная тема, все должно вести к вопросу: "А почему ты еще не купил себе тот крутой серебристо-зелёный "Линкольн"? или "Ты уже представил себя на заднем сидении со мной в том крутом серебристо-зелёном "Линкольне"?
в) есть прямой коммерческй интерес.
Небольшая сложность: тут (Ирина: ау!) нужен разговорный инглиш.
Я готов переговорить с тем человеком, который писал сайт, а он, может поговорить с продавцом машин. Если особых возражений это не вызовет, то тогда можно попробовать приступить к работе над разработкой первой попытки создания версии автоматического собеседника. Человек будет думать, что говорит с полицейской девушкой, а на самом деле будет говорить с нами.
И прагматично, и креативно, и прикольно.
В будущем возможно подключение голосового анализатора... с охами и фонациями. Но это потом. В переспективе :)

Ответить на это сообщение
 
 Откликаюсь на "ау"
Автор: Ирина 
Дата:   04-02-02 14:44

> Небольшая сложность: тут (Ирина: ау!) нужен разговорный инглиш.

Инглиш у меня не такой уж разговорный - слэнга практически не знаю (в тексте и на слух опознаю и пойму, а вот порождать...). Семь лет работала переводчиком во внешней торговле (контракты-переговоры-выставки), там лексика нейтральная плюс профессионализмы, грамматика классическая, и даже при неофициальном общении как-то на слэнг не сползали. Да и последние занятия средневековой литературой не добавили моему языку разговорности. Так что за консультациями, конечно, обращайтесь (буквально вчера, разбирая книжный шкаф, отдельным "островком" выставила словарь американских идиом, словарь американского слэнга, русско-английский разговорник бытовой лексики и слэнга и русско-английский словарь уголовного жаргона), но за то, что порожденная фраза прозвучит адекватно нынешнему языковому восприятию, ручаться никак не смогу.

Насколько я поняла из вашей предыдущей переписки, у Юлии с английским близкие отношения и есть возможность обращаться к носителям - может быть, вам даже и не потребуется моя помощь. Но если будет нужно, по мере сил помогу.

Ответить на это сообщение
 
 Ирине: Комбинации из 800 слов
Автор: Психолингвист 
Дата:   04-02-02 17:22

С английским не столько проблема с порождением правильного, сколько с порождением в принципе. Ведь найти ответ на фразу надо такой, чтобы он звучал как ответ. Должна быть связность, должно быть развитие мысли. Или хотя бы повтор другими словами. Например: "Тебя как зовут-то?" должно быть переведно в "Как тебя зовут?" и отвечено соответственно, плюс спрошено об имени собеседника. А подъязык этого, повторю, очень простой. Как у толстовских крестьян. Вряд ли более 800 слов. Другое дело, комбинации этого... 800 фак-ториал? :)

Ответить на это сообщение
 
 ... "с порождением в принципе"...
Автор: Ирина 
Дата:   04-02-02 18:51

Так это как раз у меня проблема с "порождением в принципе", я же предупреждала: я не придумыватель, я тыкатель пальцем в имеющееся и говоритель, почему мне данное имеющееся не кажется идеальным. И мой махровый филологизм не дает никаких шансов научиться играть в шахматы и просчитывать ходы (ну то есть предполагать, что может появиться фраза "Тебя как зовут-то?", которую нужно будет во что-то переводить). Анализировать имеющееся и разносить его по ячейкам структуры - это да, но для этого мне нужно окунуться во все "имеющееся" и определить, какова может быть та структура, по ячейкам которой мне придется это разносить. А мое невежество простирается до страшных пределов незнания терминов "подъязык" и "факториал". Нет, про факториал сейчас пойду спрошу у программистов, они расскажут. Пойму ли...

Ответить на это сообщение
 
 Re: с небес на бренную землю
Автор: Юлия Зайцева 
Дата:   04-02-02 18:55

Что ж, идея неплохая. Будет весьма любопытно поработать над этим проектом.
НО (на этом месте сказка кончается и начинается техническая часть)
приступим к постановке. А для этого нужно прояснить ряд сугубо прозаических аспектов.
1. Под каким сервером крутится этот сайт?
2. Какие средства реализации проекта он поддерживает (CGI, Java или ещё что) и в каком объёме?
3. Пользуются ли пограммисты сайта какой-нибудь СУБД (Oracle, SQL server или ещё чем)?
4. Хотелось бы поиметь адрес этого сайта, чтобы оттестировать его по полной программе.
Вот.
С английским у меня не так хорошо, как может показаться. Слэнга-то я набралась, а вот грамотность порастеряла, поэтому, как утверждают носители, моя манера выражаться больше бы подошла дешёвой шлюхе из Пуэрто-Рико. А это малость не соответствует образу блюстительницы закона. Поэтому Ваша помощь, Ирина, была бы очень кстати. К тому же у нас будет шанс собрать неплохую коллекцию всяких словечек и сокращений, что само по себе интересно. Консультации с носителями могу обеспечить.
И ещё одна штука, о которой как-то пока никто не подумал. Возможно, для обсуждения некоторых вещей нам проще бы было собраться в каком-нибудь уютном заведении, чем беседовать по сети (хотя это не настолько уж обязательно). Но всё-таки любопытно было бы узнать, насколько далеко мы все территориально :) Я в Москве.

Психолингвисту:
количество сочетаний из 800 элементов по m элементов, где m может принимать значения от 1 до 800, можно запиать формулой
E(сумма) от m=1 до 800 (800! / (m! (800 - m)!))
Так что всё гораздо хуже. Но, к сожалению, комбинаторика нам не потребуется, зато потребуется анализ очепяток, сокращений, синонимов и куча всякой нудятины, к тому же, поскольку это пишется для и-нета, основной нашей целью будет не написание красивой программы, а увеличение её быстродействия (за что я не люблю интернет!) Но постараюсь всё это совместить :)

Ответить на это сообщение
 
 Re:) факториал
Автор: Юлия Зайцева 
Дата:   04-02-02 19:09

Все эти хитрые термины напридумывали математики в целях прокормления своей мании величия :) Факториал - это произведение всех натуральных чисел от 1 до заданного числа. Обозначается восклицательным знаком. Напр. 5!=1*2*3*4*5
Вот и вся ихняя хитрость. Это я как бывший математик говорю :)

Зато я не умею грамотно объясняться по-английски, а Вы умеете.

Ответить на это сообщение
 
 Re:) факториал
Автор: Ирина 
Дата:   04-02-02 20:24

Спасибо за объяснение: в этой жизни у меня будет еще одно знакомое слово.

А живу я в славном граде Воронеже, 500-600 километров к югу от Москвы, одна ночь поездом.

Ответить на это сообщение
 
 о печке и о структуре
Автор: Юлия Зайцева 
Дата:   05-02-02 11:06

Ирина, вы высказали очень правильное замечание насчёт разнесения информации по ячейкам структуры. Плясать надо от печки, т.е. от структуры. А её пока нет. Предлагаю заняться именно ею.
Вот очень приблизительная прикидка структуры данных, которую нам нужно будет доработать, прежде чем перейти собственно к данным.

Таблица А. словарь.
Поля (столбцы): a - слово; b - код части речи, которой это слово является; с - эмоциональная окраска слова (возможно, окажется избыточным); d - код группы в таблице В*; e - код высказывания в таблице C (сложное символьное, может содержать последовательность кодов высказываний из таб. С, несовместимых с этим словом, если таковых больше одного).
Возможно, потребуется хранить ещё некоторые словоформы, связи и параметры.

Таблица В. смысловые группы (рекомендую создать, чтобы различать хотя бы приблизительно разные виды диалогов. Напр. если одно из слов, введённых пользователем, относится к группе анатомических подробностей интимного свойства из таб. В, а другое - к группе грязных ругательств, следует предпочесть такую-то группу высказываний из таблицы С)
Поля : a - группа; d - код группы; e - код высказывания в таб. С.
Возможно, потребуется хранить ещё некоторые признаки.

Таблица С. список высказываний (содержит готовые фразы, в которые можно вставлять или не вставлять слова из таб. А)
Поля : a - группа; e - код высказывания.
"-----"
* кодовые поля нужны для установи связей между таблицами, чтобы структурировать данные и не переполнять ими каждую из таблиц. Это как картотека с ящиками. Есть ящик с карточками слов, на каждой карточке ссылка на номера карточек в ящике с фразами, в которые может или не может это слово входить. Это удобнее, чем писать на каждой карточке кучу фраз, которые будут повторяться на других карточках.

Прикидка очень приблизительная. Надо прорабатывать.

P.S. Много раз бывала в Воронеже проездом, а города так и не видела :(
500 км - это не так уж далеко. При необходимости можно будет посетить уютное заведение где-нибудь на полпути, допустим, в Рязани :)
Сейчас выяснится, что уважаемый Психолингвист находится где-нибудь в Нью-Йорке или Токио, и работа над этой задачей покажется ещё интереснее :)

Ответить на это сообщение
 
 Немного о другом
Автор: Ирина 
Дата:   05-02-02 17:54

Юля, мне тут совершенно случайно в руки попал реферат, привожу из него первые абзацы. Если нужно, зашлю - там три doc-файла килобайт на 500, в архиве 100. С формулами и кусками программ. Автор называется "С. Короткий".

Самое смешное - точно так же "совершенно случайно" мне завтра принесут журнал "Хакер", где перечисляются основные сокращения, используемые в ICQ (ну типа "u" вместо "you" или "idk" вместо "I don't know"). Говорят, там целая страница таких сокращений...

=======
В статье рассмотрены основы теории нейронных сетей, позволяющие в дальнейшем обратиться к конкретным структурам, алгоритмам и идеологии практического применения сетей в компьютерных приложениях.
В последние десятилетия в мире бурно развивается новая прикладная область математики, специализирующаяся на искусственных нейронных сетях (НС). Актуальность исследований в этом направлении подтверждается массой различных применений НС. Это автоматизация процессов распознавания образов, адаптивное управление, аппроксимация функционалов, прогнозирование, создание экспертных систем, организация ассоциативной памяти и многие другие приложения. С помощью НС можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту. В то время как на западе применение НС уже достаточно обширно, у нас это еще в некоторой степени экзотика – российские фирмы, использующие НС в практических целях, наперечет.
Широкий круг задач, решаемый НС, не позволяет в настоящее время создавать универсальные, мощные сети, вынуждая разрабатывать специализированные НС, функционирующие по различным алгоритмам.
Модели НС могут быть программного и аппаратного исполнения. В дальнейшем речь пойдет в основном о первом типе.
============

Ответить на это сообщение
 
 Нейронные сети
Автор: Психолингвист 
Дата:   05-02-02 19:10

Была в Москве такая фирма Нейрок. Я с ними общался. Они отлавливают из потока информации то, что соответствует заказанным им ключевым словам. К примеру, задается слово "наркотик" и отлавливаются тексты о войне, об оружии, о деньгах и о музыке. Неплохо. Но очень много шума. Подобные нейронные сети выстраиваются действительно начиная с синтагм и словосочетаний. И с помощью матриц, подобно приведенных Юлией: словарь, группы, готовые фразы. (По-моему, пропущены словосочетания). И самое сложное - блок синтаксического анализа. Часть речи - хорошо, а каким членом предложения она является тоже важно.
Но схема в целом правильная. Только каталожный ящик я уже подарил...
Грамматический анализатор для русского языка я видел, но он все время был в процессе разработки. Не продавался. А зря. Я предлагал хорошие деньги. Теперь буду искать для английского языка, так как есть заказ. Да и с ним проще. Сам язык легче поддается формализации.
Продолжаем виртуальный мозговой штурм.

Ответить на это сообщение
 
 О печке же
Автор: Ирина 
Дата:   05-02-02 22:00

Над структурой я подумаю, но для качественного выполнения процесса думания мне явно будет недостаточно имеющихся данных. Структуру-то прикинуть можно, но сначала расскажите мне ("на пальцах"), ЧТО с этой структурой ПОТОМ нужно будет делать? То есть база слов-сочетаний-фраз должна быть удобна - ДЛЯ ЧЕГО? К ней будут какие-то обращения - ЧТО она должна делать в ответ на эти обращения, КАКИЕ это будут обращения? Понятно, что конечный итог - это выдача фразы-ответа полицейской барышни, но ведь сначала будет анализироваться то, что напишет клиент, - у вас будет нечто компилятороподобное? Вот тут-то и "блок синтаксического анализа", как сказал уважаемый Психолингвист: я же не знаю, как вы будете анализировать написанное клиентом, и потому вряд ли смогу сказать что-либо о структуре, как она задумывается. Насколько я понимаю, база должна "обслуживать" по меньшей мере два процесса: 1) анализ сказанного клиентом - и в зависимости от его результата 2) выбор варианта ответа (то есть 1) "разложить" и 2) "собрать"). Барышня будет изъясняться исключительно заготовленными фразами (в которые будут вставляться выбранные или указанные клиентом характеристики желаемой машины)? Или у нее будет возможность "творчества", то есть, например, вставки элементов глагольного списка данной группы в позицию, определенную как глагольная? А клиента "анализировать" как? Ну <i><b>расскажи-и-ите</b></i> поподробнее (но простыми словами, как про факториал), а то ж ведь плохо вслепую-то...

P. S. "Уютное место в Рязани" придется искать в глухую полночь: расписание подогнано так, что большинство поездов, курсирующих между Москвой и Воронежем, уходят из Воронежа (или Москвы) вечером и приходят в Москву (или соответственно в Воронеж) утром, то есть Рязань они проезжают часа в два-три ночи. Так что сначала нужно выяснить место обитания уважаемого Психолингвиста (кстати, уважаемому Психолингвисту не надоело ли быть таким "уважаемым" при каждом упоминании - может быть, уважаемый Психолингвист прикроется каким-нибудь человечьим именем?), и если нужна будет встреча в Москве, то я, может быть, смогу выбраться на какой-нибудь выходной. Заодно зайти на книжный рынок в "Юбилейном": говорят, издали Саксона Грамматика "Деяния датчан", но у нас в городе его еще никто не видел и даже не знают, сколько стоит, - Юля, у Вас случайно нет знакомых в издательствах?

Ответить на это сообщение
 
 Re: на пальцах
Автор: Юлия Зайцева 
Дата:   06-02-02 12:09

Со структурой всё просто. Машина - не человек, ей нужна точнось. В общих чертах смысл любой программы звучит так: возьми то, что я скажу там, где я скажу при условии, которое я задам, сделай с этим чем-то то, что я скажу и выдай то, что получилось. При этом данные должны лежать в тех местах, которые для них предназначены, иначе машина не будет знать, что и где. Машина не умеет читать, не умеет определять смысл слов и строить фразы и не научится этому никогда ПРИНЦИПИАЛЬНО. Наша задача - составить программу так, чтобы сделать вид, будто она это умеет. Рассмотрим простейший случай. Говорим машине: ищи во введённой строке наборы символов "собака" и "кошка". Если найден только набор "собака", скажи "гав", если найден только набор "кошка", скажи "мяу", а если найдены оба, скажи "драка". Таким образом создаётся ИЛЛЮЗИЯ, что машина понимает смысл этих слов. Но если слов много, то задавать условие каждому по отдельности ужасно скучно. Поэтому было придумано понятие "база данных" (БД). Данные заносятся в таблицы, где каждому столбцу (полю) соответствует определённый тип информации, как в обычной таблице. Строка таблицы называется записью. Рассмотрим другую задачу. Создадим таблицу А из двух полей a и b и будем заносить в поле а названия пород собак, кошек и попугаев, а в поле b - признак: 0, если это собака, 1, если это кошка и 2, если это попугай.
Таб.А
_а__________|__b_
сибирская.....|.....1
какаду..........|.....2
водолаз........| ....0
корниш-рекс.|.....1
ара...............|.....2
такса............|.....0
овчарка........|.....0
Потом создадим таблицу с наименованиями этих существ, чтобы нам не надо было мучиться с заданием каждого условия в программе.
Таб. В. поле a - наименование, поле b - аналогично полю b из таблицы А.
Получаем:
_а_______|__b_
собака.....|.....0
кошка......|.....1
попугай....|.....2
Теперь говорим машине: ищи во введённой пользователем строке наборы символов, совпадающие с какими-либо из значений поля а таб. А. Если найдено, запомни значение поля b из найденной записи в таблице А и найди в таблице В запись, где поле b совпадает с этим значением. Выдай на экран значение поля а таблицы В из этой записи. Тогда если во введённой строке обнаружится слово "водолаз", машина выдаст на экран слово "собака", и создастся ИЛЛЮЗИЯ, будто она разбирается в породах собак. Таблицы А и В для этой задачи называются базой данных. Вспомогательные поля b называются кодовыми.
Это всё, что содержит в себе вводный курс теории БД :)
В нашей задаче всё сложнее, потому что слово "водолаз" может означать не только породу пса, который сейчас валяется у меня под столом и грызёт мою пятку, а ещё и героическую профессию вполне респектабельного джентльмена, ругать которого собакой нет никаких причин.

Продолжение следует........

Ответить на это сообщение
 
 КЛАСС!!!
Автор: Ирина 
Дата:   06-02-02 13:51

Юля, ка-а-ак Вы объясняете!.. Просто сплошное удовольствие читать: все так просто и забавно (понимаю, что это не программирование есть вещь простая и забавная, а Ваше изложение его принципов, но поскольку с высотами и тонкостями программирования мне дела не иметь, то для меня все просто и забавно), мне ОЧЕНЬ нравится, спасибо.

А группы в таблице В предполагаются какие? Мат, разговорное, нейтральное, научное, анатомическое? Цвет машины, пробег, год выпуска, характеристика двигателя, количество дверей, наличие компьютера, кожаных сидений, магнитолы? Способ оплаты, срок, способ оформления? Или предполагается, что барышня будет только соблазнять клиента на поимение машины (и соответственно пригодятся только группы "мат", "разговорное" и пр.), а способ оплаты будет указан в "официальной" части сайта, к которой мы не имеем никакого отношения? Все равно цвет машины нам не обойти, а их знаете сколько?! Я как-то собирала названия цветов автомобилей (по-русски), все больше для забавы, "красных" и "зеленых" там не было, зато были "альпийский снег", "морской котик", "зеленая роща", "брызги шампанского", "полет мысли" и мои любимые "свекла перламутр" и "спинка дельфина металлик". Это не прикол, это реальные цвета, указывавшиеся в объявлениях о продаже автомобилей. Всего в списке названий сто двадцать, кажется...

P. S. Реферат про нейронные сети засылать или не пригодится?

P. P. S. Многия пардоны, "Юбилейный" - это у нас, а у вас это "Олимпийский": вчерашняя замороченность мозгов после трудового дня. Опомнилась только когда машину выключала.

Ответить на это сообщение
 
 цвета и марки
Автор: Психолингвист 
Дата:   06-02-02 18:06

Разговор приобретает всё бОльшую предметность. Всего 120 названий цветов. Это не так много. Всего 200 названий марок автомобилей. Это вообще мало. Иллюзия возможности создания искусственного интеллекта возникла именно потому, что работали с подъязыками - ограниченными объемами лексики и тематики. Задание проясняется:
Привет - привет // Как дела. - как дела.
ты кто - я девушка любительница поговорить. а ты кто?
а я такой то. - такой-то? мальчик или девочка?
мальчик. - хорошо....
(в графе для беседы можно будет сделать мало места. чтобы мыслью не растекались как бояны вещие какие-нибудь)
... ты любишь машины?
нет. не люблю - а зря, они такие хорошие.
да, люблю. - правильно, они такие хорошие. Например, Крайслер...
Знаю я про Крайслер. - а что ты знаешь про него?
... - Хорошо, а ты знаешь, что у Крайслера крейсерская скорость?
и так далее в том же духе.
З.Ы. рассказ про дазы банных очень доступен. спасибо. буду читать и перечитывать.
Ирина, послать подобие Элизы (на англ. яз) по е-мэйлу? Чтобы Вы пообщались с ней?
Пошлите Юлии свой адрес, а она перекинет мне. а я поищу в компе пока.
А пока пока. насчет реальной встречи пока не обещаю. хотя не исключаю. даже наоборот. включаю. :)

Ответить на это сообщение
 
 Немного о количестве марок автомобилей
Автор: Ирина 
Дата:   06-02-02 18:57

Насчет двухсот – это Вы погорячились. У меня есть список (действительно ЕСТЬ, притом в Excel-файле) названий марок автомобилей; так там легковых - строк тысяча и еще строк триста внедорожников. Список выстроен так: сначала указывается основная марка, а под ней – ну не знаю как назвать, "расширение" что ли... Примерно вот так:

================
<b>Toyota</b>
Aristo
Avalon
Avensis
Caldina
Camry
Camry Gracia
Camry Gracia Wagon
Camry Station Wagon
Carina (II)
Carina E Station
Carina (II) Station Wagon
Celica
Celsior
Century
Chaser
Conquest
Corolla (II)
Corolla Ceres
Corolla Compact
Corolla Levin
Corolla linea terra
Corolla Station Wagon
Corolla Tercel
Corona
Corona Exiv
Corsa
Cresta
Cressida
Crown
Crown Comfort
Crown Majesta
Crown Wagon
Curren
Cynos
Guigiaro
Glanza
Lexcen
Mark II
MR2
Paseo
Paseo Convertible
Prius
Prominent
Reflet
Soarer
Soluna
Sprinter
Sprinter Carib
Sprinter Corolla Wagon
Sprinter Marino
Sprinter Trueno
Starlet
Starlet Kat
Supra
T100
Tercel
Vista
Vitz
Windom
Yaris

<b>Volkswagen</b>
Beetle
Bora
Caddy
Corrado
Derby
Fusca
Gol
Golf (III, IV)
Golf Country
Golf Ecomatic
Golf Intercooler
Golf Kat
Golf Quartett
Golf Syncro
Golf Syncro-Country
Golf Variant
Golf Variant syncro
Jetta
Jetta syncro
Kafer
Logus
Lupo
New Beetle
Parati
Parati Wagon
Passat
Passat Comfortline
Passat Kat
Passat Syncro
Passat Variant
Passat Variant Kat
Passat Variant syncro
Pointer
Polo
Polo Classic
Polo Classic Sportline
Polo Fox
Polo Kat
Polo Servo
Polo Steilheck
Polo Steilheck Fox
Polo Variant
Rally Golf
Quantum
Santana
Scirocco
Scirocco Kat
Citi Golf Blues
Citi Golf Chico
Senda
Taro
Vento
==============

Ответить на это сообщение
 
 Re: омонимы и времена
Автор: Юлия Зайцева 
Дата:   06-02-02 19:35

Ирина, спасибо за комплимент. А программирование ДЕЙСТВИТЕЛЬНО очень простая и забавная вещь. Просто занудные снобы вечно выдумывают всякие побасенки о его сложности и заумности для сокрытия своего немарсианского происхождения. На самом деле все языки пограммирования вместе взятые гораздо проще, компактнее и логичнее, чем любой из человеческих, так что программирование требует гораздо меньших знаний, чем лингвистика. А вот разработка методов - это настоящий геморрой :)

Тепрь по поводу данных. (Ирина, вы очень быстро схватываете суть! :) С цветами и марками машин всё просто. Можно добыть где-нибудь каталоги, а на все вопросы о дальнейших подробностях отвечать фразой типа "Hey buddy! Scrape the dust off yr screen just on the left of my boobs & have a look @ our price list."Можно даже брать данные о машинах из базы сайта, но чтобы это сделать, мне нужно знать, как эти данные храняться и на каком языке это всё писать. Пока я этого не знаю (оч-чень забавная манера работать:) А по поводу групп сама вот голову ломаю. Определённо, должна быть группа всякой прагматики (и с этимм отдельный геморрой); ругательств тоже не избежать; анатомия - детально :); слэнг - умеренно; цвета и марки машин - сколько есть (я не уверена, что в английском их так много пишут в тех. паспорте, как у нас; кстати, с недавних пор и у нас стало меньше); автомобильная техническая терминология - на бытовом уровне; сокращения - максимально. Кстати, о птичках. Ирина, скажите, пожалуйста, в каком номере журнала "Хакер" Вам встретился список сокращений? У нас он свободно продаётся. И за реферат про нейронные сети скажу большое спасибо: всегда интересно почитать о нейронных сетях на сон грядущий :) Хотя наша задача к ним отношения не имеет.

Ирина, будете в Москве - милости прошу в гости. А ещё я знаю кучу классных книжных магазинов. И знакомые у меня есть в издательствах, так что про "Деяния датчан" поспрошаю.

Психолингвисту:
Я тоже чуть было не поработала в "Нейроне"; приглашали, да только у меня контрактов тогда было на 2 года вперёд; не вышло, а жаль. Интересно, кто нынче, кроме микрософта, серьёзно занимается разработкой анализатора для русского языка? Отчаянные, поди, ребятки; уважаю :) Если найдёте анализатор английского, киньте, пожалуйста, линк. А если Вам кажется, что английский лучше анализируется, и у Вас сегодня хорошее настроение, то вспомните об омонимах, которых в английском куда больше, чем в русском, о свободном переходе частей речи друг в друга и о количестве времён, которыми в разговорной речи часто пренебрегают :)
Словосочетания, возможно, пойдут к словам. сделаем отдельную группу с отдельным управлением. Думать буду.
Любопытно смотрелся бы вопрос "мальчик или девочка?", если бы на связи оказался какой-нибудь John, Bill или Hot Macho. Или какая-нибудь Mary, Lisa или FatBlackZelda. От группы имён нам тоже не отвертеться, а то придётся каждый раз оправдываться, мол, сами знаете, сколько в сети этих самых {политкорректность} :)
P.s. Уважаемый Психолингвист. Ну Вы и конспиратор! :))))))

Ответить на это сообщение
 
 Re: Ух ты!!
Автор: Юлия Зайцева 
Дата:   06-02-02 19:38

Ирина! Вы просто клад! Вот как надо работать!

Ответить на это сообщение
 
 Коротенько ответы
Автор: Ирина 
Дата:   06-02-02 20:07

"Хакер" был номер 4 за 2001 год, и сокращений там оказалось вовсе не на страницу (на страницу там было всяких русских обозначений с расшифровкой, типа "крысодром - коврик для мыши"), а тех, которые вожделенные английские сокращения, оказалось всего ничего - штук двадцать, причем таких, которые знаю даже я. Списочек, если нужно, могу заслать, но мне кажется, что Вы, Юля, их навскидку вспомните гораздо больше, а если где-нибудь найдете список - то он будет несравненно богаче этих двадцати "хромых" строк.

Об именах клиентов и о "мальчик-девочка": мне кажется, что во избежание проблем с политкорректностью и заморочек со списком возможных имен и прозвищ (представляете, список прозвищ?) можно обойтись и без процедуры знакомства с клиентом (пусть барышня представится - и все). Понятно, что по имени интимнее и легче влиять и т. д., но если отсутствие информации о том, какой пол клиент себе приписывает, не повлияет на то, какую машину мы ему предложим, то, может быть, обойтись без клиентских имен?

Автомобильная техническая терминология и особенно то, в каких сокращениях она может встречаться - вообще не знаю, где брать. В англ. терминах ориентируюсь слабо, "перед глазами" не встречала. По-русски, в общем-то, тоже знаю только некоторые термины без их связи с действительностью...

Большое спасибо за "быстро схватываю", отдельное большое и искреннее спасибо за приглашение в гости, добавочное спасибо за знание книжных магазинов и уж совсем отдельное и ОГРОМНОЕ спасибо за "поспрошать" о "Деяниях датчан". Кстати, "поспрошать" - мое любимое словечко...

А Психолингвист - действительно конспиратор... "Элиза" под чем работает, сколько памяти требует и сколько в почте будет весить?

Ответить на это сообщение
 
 Снова о "мальчик-девочка"
Автор: Ирина 
Дата:   07-02-02 13:13

Я тут подумала вот что: мы как-то предполагаем, что наша полицейская барышня "в мини-юбке с макси-попкой" всем сильно поможет раскрутить клиента на машину. А если клиент женщина? Ей что, больно интересно будет общаться с нашей девахой, а не с мускулистым ковбоем или тонким принцем? А у них там на гнилом Западе поголовная феминизация, там дамам не мужья-любовники машины покупают, а каждая сама себе, причем "автомобилизация" там тоже поголовная...

Понятно, что ежели мы все-таки выясним клиентский пол и окажется, что клиент женщина, то фразам типа приведенной Юлией {кстати, почему вы решили, что переводчик вам непременно понадобится? я такую фразу не смогу породить никогда в жизни, терминов не хватит - в средние века так не выражались :))...} можно дать указание "не выбираться" при разговоре, но как подействует на среднестатистическую западную женщину тот факт, что на сайте ей придется общаться с крутой сексапильной девахой, явно поставленной соблазнять ни в чем не повинных граждан, зашедших посмотреть на машинки?.. Получается, что теряется изначальный постулат "она должна раскрутить клиента на покупку автомобиля"...

Ответить на это сообщение
 
 Re: Снова о "мальчик-девочка"
Автор: Психолингвист 
Дата:   07-02-02 20:09

о.к. можно сделать двух: одного мужика с дубинкой, другую деваху с фонариком (чтоб в глаза светила). и про пол не спрашивать, а только имя почаще употреблять. и со сленгим можно тоже:
- ты любишь сленг, а умеешь без него? и далее по тексту.
на днях спрошу про профиль посетителей сайтов. по-моему, там много тинов, хотя есть и солидные люди, есть и таксисты (убеленные сединами).
з.ы. если интригует моя "конспирация", то это просто проявление "прайваси".
ктсати. никогда не мог понять, почему это так важно. мне лично очень мешает. отвлекает по типу.
для начала могу признаться. что я мужескаго полу.
едем дальше?

Ответить на это сообщение
 
 Re: Снова о "мальчик-девочка"
Автор: Ирина 
Дата:   07-02-02 21:32

> можно сделать двух: одного мужика с дубинкой, другую деваху с фонариком (чтоб в глаза светила)

А говорильное окошко (место, где будет появляться реплика) у них будет одно на двоих? Тогда как клиент определит, кто именно из них предлагает ему "представить себя на заднем сиденье вместе со мной"? Вдруг мужик с дубинкой? Распугаем всех! А если говорильные окошки будут разные, то тогда нужен клиентский пол, чтобы опять же знать, от чьего имени предлагать общение на заднем сиденье.

> ты любишь сленг, а умеешь без него?

Коряво как-то... Ни к чему не приведет: вряд ли среднестатистический американец четко отделяет в сознании слэнг от нейтрального языка. Ну как у нас уже слово, простите, "хрен" стало чуть ли не литературным, а ведь ругательство... Вот он вам, допустим, скажет, что без слэнга он умеет, и вы ему что - выдадите список терминов, которые ему позволено использовать в данной беседе?

Можно вместо выспрашивания про клиентское отношение к слэнгу почаще призывать его (клиента) к употреблению нормативной лексики, мотивируя это тем, что он разговаривает с представителями закона. Хотя тоже запугивание...

> если интригует моя "конспирация", то это просто проявление "прайваси"

Вполне понимаю, но не столько интригует конспирация (я же тоже почтовый адрес в форуме не засвечиваю), сколько доставляет некоторый дискомфорт отсутствие человеческого имени, которое при упоминании в третьем лице не требовало бы дополнения "уважаемый" для того, чтобы не выглядеть кличкой.

> Никогда не мог понять, почему это так важно.

Знание имени? Так ведь мне не паспортные данные хотелось знать, а однословный способ обращения вместо двусловного. А указать местонахождение (для планирования или непланирования встреч) - это, по-моему, не благодеяние, а вежливость в ответ на то, что двое других собеседников публично определились географически.

> для начала могу признаться, что я мужескаго полу.

Н-ну как бы так сказать... Вот уж пол меня интересовал меньше всего... Я же тут с мозгами Вашими пытаюсь общаться, а не с другими частями тела...

> едем дальше?

Запросто...

Ответить на это сообщение
 
 продолжение
Автор: Юлия Зайцева 
Дата:   08-02-02 12:55

Всё-таки я решила чуть-чуть ещё поболтать о технической стороне, чтобы потом было проще.
Переходим к спец. курсу :) Рассмотрим задачу. Возьмём таблицу А из предыдущего примера и добавим к ней ещё 2 поля (y и z), которые пока заполним нулями. Будем записывать в поле а не породы зверья, а разные слова, а в поле b - относительную степень их грубости.
Таб.А
_а__________|__b___y__z_
негодяй.........|.....2..|.0..|..0..|
зануда..........| ....1...|.0..|..0..|
злыдень........|.....1...|.0..|..0..|
чувак............|.....0...|..0.|..0..|
супостат........|.....1...|.0..|..0.|
ж***...............|.....3...|..0.|..0.|
гад................|.....2...|.0..|..0.|
дружище.......|....-1...|..0.|..0.|

Возьмём таблицу В из предыдущего примера и запишем в неё названия групп слов в соответствии с полем b таб. А (чтобы каждый раз не писать "поле такое-то таблицы такой-то", принято сокращение "таблица.поле". Напр. поле n таблицы K обозначается выражением K.n)
Таб. В*
_а______________________|__b_
хамство..............................|.....3
наглость.............................|.....2
стоит призадуматься...........|.....1
у каждого свои недостатки..|.....0
совсем другое дело............|....-1

Создадим таб. С, где а - ответные фразы, а b аналогично А.b и B.b
Таб. C
_а_______________________|__b_
Да пошёл ты!.......................|.....3
Как не стыдно!.....................|.....2
Сам такой............................|.....1
Отставить фамильярность!...|.....0
Спасибо за комплимент.......|....-1

Теперь говорим машине:
1. Ищи во введённой пользователем строке наборы символов, совпадающие с какими-либо из значений А.а . Если найдено, запомни значение А.b каждого из них.
2. Возьми значения А.b всех найденных записей и найди среднее арифметическое. Умножь А.х каждой найденной записи на A.z, прибавь полученное среднее арифметическое и раздели результат на A.z+1. Замени A.x на полученный результат, а A.z на A.z+1.
3. Найди ближайшее значение С.b к найденному среднему арифметическому. Выдай на экран значение С.а найденной записи.
4. Ищи во введённой пользователем строке набор символов, не совпадающий ни с какими из значений А.а . Добавь в A новую запись и занеси в A.a этой записи найденный набор символов, в A.x - среднее арифметическое, найденное во 2 действии, а в A.z 1.
Комментарии.
Действием 2 мы находим "среднеарифметиеческую" степень грубости всей фразы, а в A.x собираем статистику грубости фраз, в которых нам встретилось это слово, и каждый раз, когда мы это слово встречаем, статистику корректируем. В А.z мы храним суммарное кол-во нахождений данного слова в пользовательских фразах. Действием 3 мы находим соответствующую степень грубости ответной фразы. Действием 4 мы добавляем в таблицу незнакомые слова, присваивая им степень грубости фраз, в которых они находились.
Можно ещё задать условие, чтобы после набора определённго значения A.z программа начала раcсчитывать степень грубости не через A.b, а через A.x. Таким образом, наша программа учится новым словам, оценивает частотность и улавливает новые тенденции в словоупотреблении. Ура! Мы разработали экспертную систему (а термин-то какой страшенный! :)
* таблица В в расчётах не участвует и существует только для наглядности.
Это, конечно, просто схема. На самом деле всё немного сложнее.
Если интересно, то напишу ещё продолжение.

Ответить на это сообщение
 
 Да! Да! Интересно!!!
Автор: Ирина 
Дата:   08-02-02 13:56

Хочу, хочу продолжение! Безумно интересно, завлекательно, четко и понятно, так что пишите-пишите: польза (для меня, например) несомненная.

А потом соберете и издадите, порадуете много народу. Я вам как корректор запятые проверю и как филолог аннотацию напишу - жутко хвалебную, естественно.

А пока почитаю то, что есть. Спасибо!

(Отдельный пардон за переход на строчное "вы", но при сложившемся здесь стиле общения "Вы" с заглавной буквы для меня стало выглядеть пушечным ядром на фоне шрапнели: тяжеловесно и не в тон. Ежели не нравится, перейду обратно на пушечное ядро.)

Ответить на это сообщение
 
 Снова о "мальчик-девочка"
Автор: Юлия Зайцева 
Дата:   08-02-02 15:04

Технически вопрос выбора между мачо с дубиной и знойной красоткой решается просто: ставяся две кнопки, одна для мальчиков, другая для девочек, и сам супостат жмёт на нужную. Так что можно оставить ориентацию клиента на его совести. :)
Насчёт того, зачем нужен переводчик с английского. В том-то и дело, что я умею болтать на слэнге и больше ничего. А вот для подбора нормального словарного запаса, анализа структуры фраз и т.д. моя манера обращения с английским по принципу "не своё - не жалко" не полезна, а вредна. Мы же не ставим себе целью наплодить в сети косноязычных шлюх и бывших узников лагерей строгого режима :)

P.s. Уважаемый Психолингвист! А давайте мы вам какое-нибудь имя придумаем - ну... скажем, Полуэкт :) - и будем этим именем называть. Это и инкогнито не нарушит, и проблему амортизации клавиатуры решит. Ладно?

P.p.s. Ирина, спасибо за статьи о нейронных сетях. Очень толково и популярно написанный вводный курс. Запустила вопрос о деяниях датчан по знакомым из издательств. Пока тишина, не знает никто. Но может выяснят. И про строчное "вы" очень правильно замечено. Это большое "В" уже действительно не шибко уместно. Долой его! :) А продолжение к трактату о простоте программирования обязательо напишу, когда время будет. Не знаю, правда, кому, кроме нашей компании, будет интересно его читать, но трепаться об этом могу бесконечно :)

З.ы. У меня есть классная программка, которая автоматически переключает шрифты при наборе смешанных текстов. Работает отлично. Я уже почти забыла, как они переключаются руками. Могу поделиться.

Ответить на это сообщение
 
 замена имени
Автор: Психолингвист 
Дата:   08-02-02 18:13

Система обращений типа old chap, buddy здорово Вами, юлия (то есть вами Юлия:) продумана в плане перевода модальности-тональности. Это по типу регистры коммуникации. Не думаю, что каждый человек чувствительность может подобную проявить, но в машину заложить это проще. Как бы (терпеть ненавижу это "как бы").
И посылы типа fu** тоже можно расклассифицировать. И напрогнозировать реакции. Правда, связность всего дискурса будет страдать, точнее уменьшится до связности двух рядоположенных высказываний. Но в реальном чате такое сплошь и рядом. Редко удается сохранять тематику сквозно. Но у Нас (нас? нАс? наС?) в этом отношении явно прогресс. Мы не уходим от темы. Так отвлекаемся изредка с тем, чтобы ввернуться еще глубже.
P.S. про свой пол упомянул поскольку это первая строка всех анкет: male - female. Третьего не дано. Уж не обессудьте. И harassment не приписывайте.
P.S. С большим удовольствием заменил бы имя. Но multiply personality disorder не увлекаюсь. Было как-то, но когда дошел до 4 раздвоений, пришёл пятый и всех других замочил. С тех пор стараюсь придерживаться одного ника (пятого:). А впрочем, зовите как хотите, только в горшок не сажайте :)

Ответить на это сообщение
 
 Re: Снова о "мальчик-девочка"
Автор: Ирина 
Дата:   08-02-02 18:45

Боюсь, что кнопочка нам тоже мало чем поможет. Ну вот жмет он кнопочку "я мужчина" - и мы станем усиленно уговаривать нашей барышней. А вдруг ему барышни безразличны? А если он жмет, скажем, на кнопку, означающую "хочу общаться с барышней", то это совсем не значит, что клиент мужескаго полу, как выражается наш Полуэкт, а нам ведь как-то нужно будет к клиенту обращаться и какие-то соблазнялки выдавать...

Кстати о Полуэкте: имя-то какое удобное! Если будет обижаться, можно обзывать более уважительно - Полуэкт ибн Полуэктович. Правда, это так же длинно, как "уважаемый Психолингвист", но несравненно приятнее. И намного знакомее. Да и само имя предполагает разноплановость, многоликость и некоторую таинственность (ведь столько персонажей, и все сказочные!), так что уважаемому Психолингвисту должно, наверное, понравиться. А для самых торжественных случаев можно использовать форму "Экт", без "полу-", чтобы прилюдно не приписывать уважаемому Психолингвисту половинчатости. <i>...Вот выследит он нас, когда задумаем встретиться, и придет бить морду...</i>

За датчан спасибо, я тут тоже завтра пойду общаться с людьми, которые об этом могут уже что-то узнать, так что, может быть, объединенными усилиями придем к вожделенному обладанию теми датчанами вместе с их деяниями. Я просто подозреваю, что тираж там оч-ч-чень небольшой, сейчас такое массово не издают - ну тысяча экземпляров, ну три тысячи, ну максимум пять. Да и цена... Говорят, издали двухтомник Фомы Аквинского, и стоит он в издательстве, без накруток, две с половиной тысячи рублей, и тираж то ли 500, то ли 1000 экз. Хорошо, что я не занимаюсь католицизмом, а то бы извелась уже...

А как программа переключает шрифты? Сама определяет, какому языку соответствует вводимая мной комбинация букв?

Ответить на это сообщение
 
 Имя и ориентация
Автор: Психолингвист 
Дата:   09-02-02 19:23

Беседуйте с высланной вам Элизой (в этой ее разновидности) и не концентрируйтесь на имени и поле (gender). Не в энтем дело.

Как продвигать клиента к покупке - вот что важнее всего. А имя, кстати, все системы (в том числе и человеческие) используют то, которое клиент сам себя дал. Думаю, что в этом есть глубинный смысл. Кстати, у меня несколько написаний имени, данного мне при рождении, в разных документах, поэтому мне тут удобнее пользоваться тем, которое тут в строке "Ваше имя".

Насчет секс. ориентации согласен. Тоже можно ослабить концентрацию.
А вот вопрос профессии может быть важен. Кем вы работаете или работали? И тут простор для ассоциаций. Надо погрузить клиента в знакомую ему среду и раскачивать (ориентировать) его в сторону необходимости покупки крутой такой тачки.
Едем дальше.

Ответить на это сообщение
 
 Те, с кем предстоит...
Автор: Психолингвист 
Дата:   09-02-02 23:54

Те, с кем предстоит общаться нашей будущей Полизе на 50% водители такси, на 30% представители разных служб и компаний, на 10% подростки и на 10% фанаты. Для всех важна надежность и цена. Поэтому вопросы пола явно отходят на второй план. Вопрос расы в связи с мультикультуральностью тоже отпадают. Тут должно быть всё нейтрально.
Доверие к партнеру относительное, так как такого явления, как честный продавец машин, не существует в природе (после юристов и продавцов домов на третьем месте по недоверию).
Поэтому общение будет лучше даже с без-образным существом.
А ю акей? Ты чево любишь? Кстати, слэнг тоже можно снять. Ведь Элиза говорит: Я не понимаю этот язык. Так что можно и приучать потихоньку тамошних мерканцев к литературной мове :)

Ответить на это сообщение
 
 Re: тачки и ассоциации
Автор: Юлия Зайцева 
Дата:   10-02-02 00:20

Простор для ассоциаций - это ИМЕННО то, чего нам стоило бы бояться как чёрт ладана. Наша задача - как раз удержать все диалоги в рамках некоего подъязыка, причём в наших же интересах сделать его компактнее. К тому же многие граждане свободного мира воспринимают вопрос о профессии в малознакомом месте как бестактность или проявление нездоровой канцелярщины и говорят в ответ что-то типа "старший помощник пониженного в звании денщика отставного боцмана по чистке гальюнов". Я, например, обычно поступаю именно так :) И могу со всей ответственностью заявить, что ни один программист в мире пока ещё не смог наделить экспертную систему чувством юмора, достаточным для адекватного восприятия всего спектра подобных ответов. Можно, конечно, как-то вывернуться, но лучше изначально сузить задачу, зато сделать её добротно.
По поводу ориентации. Отчасти верно. Но если уж мы собрались создавать образ девахи с обширными формами, то было бы по меньшей мере странно заставлять её обсуждать с клиентом исключительно преимущества инжектора перед карбюратором и величину таможенных пошлин на японские тачки. И даже не потому, что это нелогично, а потому что не менее четверти клиентов (в основном подростки) будут начинать беседу примерно так: "Why a hell r u sitting here in this hole? If i had an ass like yours i'd star in Hollywood!" Я вообще хотела предложить ввести в структуру данных по 2 значения эмоциональной окраски для каждого слова: одно для мужчин, другое для женщин. Иначе эти вещи становятся гораздо менее программируемыми. Но теперь уже засомневалась. Хотя можно пойти и другим путём: сделать формы девахи менее обширными. Или на все подобные реплики отвечать лаконичным: "Listen u, motherf***er, drop dead! I’m not a whore you lousy bastard! F*** off u dirty shitty idiot! Get the drift? Want some zig-zig eh? Then go round the corner and flong yr dong ‘till buggers hook u & f*** yr stupid ass! If I c u frigging around here next time, I’ll gripe yr balls & bum-rush u from this honky-tonk in yr birthday suit! If u, freaky fart, don't piss off now, I'll kick u all the way 2 the quit button!" И тогда толпы народу мигом сбегутся на этот сайт, чтобы узнать, что такое настоящая ругань :)
А если серьёзно, давайте попробуем всё-таки более чётко с подъязыком определиться, а? Это принципиально. И должно быть сформулировано. Давайте сосредоточимся и соберём-таки комплект этих чёртовых групп. А потом всё будет проще. И ещё про обращения было очень правильно замечено: надо с ними быстренько разобраться. Я-то, когда этого buddy ввернула, о тональности-модальности не очень думала, но вообще-то с этим надо что-то делать :)

P.s.Программа переключения шрифтов сама определяет язык и делает это недурно. Но всё равно функция ручного переключения сохраняется.

Да, что-то обидели издатели Фому Аквинского...:) Хотя мне он не очень-то симпатичен. Раз уж зашёл разговор о книгах, может, кто знает, выходил ли когда-нибудь на русском языке перевод Корана с комментариями Саади? Я в сети нашла отрывки, но хотелось бы весь...

P.p.s. А как раздваиваются multiple personalities: в геометрической прогрессии или в арифметической? В смысле, способна ли к раздвоению каждая из порождённых личностей или только первая? И что служит фактором активации пятой? :)

Ответить на это сообщение
 
 Re: Те, с кем предстоит...
Автор: Юлия Зайцева 
Дата:   12-02-02 00:52

Ладно, согласна. Сделаем тогда упор не на флирт с клиентом, а на машины.
Если предстоит общаться с подростками и дальнобойщиками, то лучше уж слэнг оставить. Да со слэнгом и проблем больших не будет: общеупотребительных выражений не так уж много. Я попробую прикинуть необходимый минимум. И сокращениями всякими займусь. А потом надо будет словарный запас набирать. Вот.
P.s. Небольшая ремарка. Подавляющее большинство американских таксистов - это иммигранты, плохо говорящие по-английски. В основном выходцы из Индии и прочих экзотических мест.

Ответить на это сообщение
 
 Деяния датчан
Автор: Юлия Зайцева 
Дата:   12-02-02 12:42

Тут случайно попался на глаза сайт, где "Деяня датчан" выложены. Правда, по-английски.
http://sunsite.berkeley.edu/OMACL/DanishHistory/

Ответить на это сообщение
 
 Re: Деяния датчан
Автор: Ирина 
Дата:   12-02-02 14:50

...Что-то всего накопилось много...

...За ссылку на датчан спасибо, но там я уже была. Это сайт Калифорнийского университета в Беркли - классный, кстати, сайт, там хорошая библиотека средневековостей и скандинавостей, и еще есть очень большой раздел о Джеке Лондоне - с текстами всех произведений и с фотографиями тех мест в Беркли, где он жил. "Деяния датчан" я оттуда слизнула, они у меня есть doc-файлом и распечатанные, но там только девять книг из шестнадцати и есть строчечка о том, что полного варианта "Деяний" в сети для публичного доступа нет.

...Издатели обижают не только Фому Аквинского, они сейчас многие хорошие вещи издают мелкими тиражами, качественно (тисненая обложка, лаковая суперобложка, белая бумага) и соответственно дорого. Года два назад они так исландские саги издавали: двухтомник вышел тиражом 3 тыс. экз., условный "третий" том (в другом исполнении, другого издателя, с другой научной редакцией, процентов 80 саг по-русски там впервые) - всего тысяча экземпляров, и все это с тех пор не переиздавалось. Те мои знакомые "книжники", которые возят книги из Москвы и которые привозили мне описанные три тома саг, мне-то их привезли, а себе сразу взять поленились. Так вот и ходят за мной с тех пор, хотят у меня третий том купить уже и за двойную цену, так ведь я-то не отдам... Мне никогда не было понятно, зачем издателям это нужно, - ну издали бы в тонкой обложке, на газетной бумаге и тиражом тысяч пятьдесят или сто - оно, по крайней мере, в библиотеках бы осело, а так только в частные руки, причем избранные. Такое впечатление, что кто-то богатый себе редкую библиотеку собирает (способ вложения капитала) и под это дело дает нескольким ученым позаниматься любимым делом, подготовить издание, опубликовать и защититься. Ну да ладно.

... Упомянутые "книжники" заслали гонца в Москву для выяснения судьбы датчан, гонец обещал вестей к следующей субботе. В следующую субботу я к ним пойду, заодно спрошу и про Коран с комментариями Саади. Может, что знают. Они люди грамотные: трое из них заканчивали университетский истфак, а один - РГФ (факультет романо-германской филологии в университете, где и я училась). Будут новости - сообчу.

...Обращения, слэнг, группы и пр. Полистала словарь уголовного жаргона (русско-английский и англо-русский) - нужно будет какой-нибудь маленький кусочек заслать, чтобы вы посмотрели, что это такое. Там эмоциональных помет никаких, просто куча слов-синонимов и к ним нейтральный их эквивалент типа "passive homosexualist". Вещь ценная, только вот что с ней делать - выбирать куски и руками набирать в подобие базы? Сканировать и распознавать - больше мороки получится: формат книжки небольшой, и не на каждой странице нужная нам информация есть.

...Программа переключения шрифтов пока, наверное, не нужна. Хотя пригодится, если придется как раз набирать руками куски из словаря. Весит она сколько?

Ответить на это сообщение
 
 словари жаргона
Автор: Юлия Зайцева 
Дата:   12-02-02 18:18

На вопрос о тиражах и ценах на книги издатели отвечают совершенно по-марксистски. Спрос низкий, тиражи соответствующие. В дешёвом издании окупаются только Пелевин да Маринина (не к обеду будут помянуты), а к приличной литературе подход циничный: те немногие, кому это надо, купят за любые деньги. Вот на них, т.е. на нас, гешефт и делается :) Некоторые вещи теперь проще через amazon.com заказывать, чем здесь искать. У меня, кстати, много интересных штучек оттуда есть. Напр., почти весь Рушди на английском. Приезжайте, поделюсь.
По поводу тасифара Саади. Я знаю, что сейчас готовится перевод и некоторая его часть уже сделана и даже есть в сети. Но по закону подлости, не та часть, которую мне страсть как хочется почитать. Но я не знаю, первый это перевод или нет. Если есть какой-то другой, то я бы уж за ним поохотилась :)
Словарь жаргона у меня есть. Правда, только англо-русский, зато толстенный. И не очень свежий. 1994 г. издания. Но я немножко сленгом интересовалась, так что отобрать более-менее общеупотребительные словечки могу. К тому же я знаю несколько мест в сети, где есть постоянно обновляемые словари.
http://www.ocf.berkeley.edu/~wrader/slang/
(небольшой аккуратненький словарик сленга с примерами)
http://www.slangsite.com
(бестолковый, но о-о-очень большой)
http://www.notam02.no/~hcholm/altlang/ht/English.html
(маленький, но с самой подходящей терминологией)

http://www.netcomuk.co.uk/~echoes/acronym.html
http://www.abarnett.demon.co.uk/atheism/msgdict.html
(словари сокращений)
На самом деле, мне за всё время болтовни в сети систематически встречалось от силы десятка 2 сокращений и не более 100 выражений, относящихся собственно к жаргону, из них половина австралийских. Так что проблем особых не будет. Перечитаю ICQ и наберу словарик :)

Ответить на это сообщение
 
 Re: словари жаргона
Автор: Ирина 
Дата:   12-02-02 21:11

За ссылки спасибо, я их в отдельное место записала, и ежели придет нужда заговорить на этом... гм... языке, воспользуюсь. Хотя и понимаю, что не владеть мне им так же виртуозно, как вы, - от вашей ранее приведенной "лаконичной" фразы у меня просто в зобу дыханье сперло, захотелось восхищенно выдохнуть и растечься по полу студнем...

За предложение поделиться Рушди тоже спасибо, но как-то не родные мне все эти исламские товарищи. Хотя и поувлекалась я в университетские годы арабской энд персидско-таджикской лирикой. Уже, правда, мало что помню. Потому что через "Авесту" плавно перешла к гностикам и раннему христианству, а потом внезапно скандинавы хлынули.

Но это так, лирика. А по делу что? Какая реальная помощь от меня сейчас нужна? Список автомобилей так и живет в Excel-файле, когда будет нужно - отправлю, только скажите. Список автомобильных цветов (тот самый, по-русски) понадобится ли?

Ответить на это сообщение
 
 И еще одна Реплика
Автор: Посторонний 
Дата:   13-02-02 00:00

Слежу за вашей перепиской, и мне она очень нравится.
Я получаю истинное наслаждение от "общения" с вами, особенно после того, как к дискуссии присоединилась Ирина.
Успехов вам в реализации задуманного.

FUI:
Если вдруг в ходе вашей работы вам понадобится добрый совет по чему-нибудь компилятороподобному, то можете обращаться.

Ответить на это сообщение
 
 Речевые формулы
Автор: Психолингвист 
Дата:   13-02-02 17:05

Чувствуя, что возникает некоторое отвлечение от заявленной темы, я хочу перейти от обсуждения создания баз данных для слов к обсуждению создания баз данных для выражений. К примеру, если собеседнику что-то не нравится в партнере, то с точки зрения корректной коммуникации, ему следует говорить не о другом, а о себе. Точнее, если тебе что-то не нравится во мне, то для меня будет лучше, если ты скажешь мне не о том, каков я, а о том, что ТЫ чувствуешь.
Формула: Когда ты (делаешь что-то), я чувствую (эмоция) потому что (причина) и в будущем я хотел бы, чтобы ты (просьба-требование).
Мой вопрос: насколько реально создание таких моделей с точки зрения программированного подхода?

Ответить на это сообщение
 
 Re: абсолютно бесполезный ответ :)
Автор: Юлия Зайцева 
Дата:   13-02-02 21:39

Полуэкт (ну пожалуйста, скажите что вы не обижаетесь на меня за это имя, а то мне очень стыдно будет, я сделаюсь глупой и косноязычной :), если я правильно поняла ваш вопрос, то вас интересует обработка таких фраз на входе. Ответ на этот вопрос настолько же прост, насколько и бесполезен. Строго говоря, программируемо всё, даже решение неопределённых интегралов. Только для этого надо собрать бесконечное количество табличных значений, которые бы соответствовали бесконечному количеству неопределённых интегралов, имеющих решение. Но универсального математического метода решения неопределённых интегралов не существует. То же самое относится к программированию языковых анализаторов. Если вы забиваете в программу достаточное количество "скелетов" фраз данного типа, достаточно большой словарь для последовтельного сужения спектра даваемых ответов по семантическому, эмоциональному и т.д. показателям и соответствующие "скелеты" ответных фраз, то это программируемо. Но если вам попадётся фраза неописанной структуры, то она анализироваться не будет или будет, но частично. По причине отсутствия универсального метода. Для преодоления этого рода проблем было создано несколько методов построения т.н. систем с нечёткой логикой. Они позволяют с большей или меньшей степенью приближения достраивать структуру с неполными данными. Если хотите, я вам сброшу очень толковую статейку по этому поводу.
Что касается нашей задачи, то, к сожалению, мы не можем себе позволить никаких сложных алгоритмов: это снизит скорость работы приложения до недопустимой. Так что стоит сосредоточиться на наборе компактного словаря (я поищу в сети готовый, но, возможно, не найду) и разработке "скелетов" фраз. Я обязательно расскажу о методах их построения, но чуть позже: сейчас со временем совсем труба.

Ирина, марки автомобилей в Екселе сливать не надо: я уже их собрала в таблицу. Программа переключения клавиатуры в zip'е весит 650 К. И ещё у меня есть идиотский вопрос на тему скандинавских мифов, который меня давно гложет. Этот жуткий бог Один с вороном вместо глаза - откуда он взялся? Неужели это фольклорный персонаж?

Ответить на это сообщение
 
 Re:
Автор: Юлия Зайцева 
Дата:   13-02-02 21:51

Спасибо за поддержку, уважаемый Посторонний! Обнаглею и поймаю вас на слове (о добром совете которое:). Вам случайно не попадались где-нибудь листинги чатботов со словарями по-английски? А то так лень с данными возиться... :) Если попадались, киньте, пожалуйста, линк. Это единственное, чего мне не хватает, чтобы сплясать лезгинку на крышке гроба американской мечты :)

Ответить на это сообщение
 
 Re:
Автор: Посторонний 
Дата:   13-02-02 22:36

Увы, многоуважаемый Генератор идеи!
Листинги мне не попадались ни разу, но если вдруг, то обязательно сообщу.

Ответить на это сообщение
 
 А ну, повтори
Автор: Психолингвист 
Дата:   14-02-02 02:16

Спасибо за введение в программирование. думаю, для непонятных фраз можно давать Say it again please в первый раз. потом: say it in other words, please затем can you use other words, please и только потом (коээфициент терпения = 4) Sorry I do not understand. Hold on, I shall swithc you to a human being :) Иначе, действительно, мы будем вынуждены перевести весь "мягкий" язык на язык жестких форм. и он потеряет свою содержательность. а это не есть карашо.

Ответить на это сообщение
 
 И вовсе он не жуткий, бог как бог...
Автор: Ирина 
Дата:   14-02-02 16:38

Гм-м-м-да... Хотя в контексте "Полуэкта" скорее "мнэ-э-э"... Умеете вы, Юля, лаконичные вопросы задавать. "Спроси у Гэндальфа: узнаешь, какие бывают длинные ответы на короткие вопросы"...

Дело в том, что "откуда он взялся" - это то самое, чем я серьезно заморочилась год назад, и с тех пор ищу отголоски ответов везде, где только можно. Эх-х-х-х, не миновать нам встречи в Москве - потому что никакой форум моих лекций не выдержит. Да и "лекции" тогда надо будет писать, а на это время нужно. А разглагольствовать - это не писать, это легче.

Не могу сказать, что ответ я знаю, есть только предположения. Точного ответа, собственно, не знает никто: дело давнее, сведений мало. Веку к шестому Один уже был почитаемым богом (изображения сохранились), Тацит упоминает, не называя имени, некоего бога, которого можно соотнести с Одином, - то есть в первом веке он уже предположительно был. А первые (по хронологии) нормальные литературные памятники у исландцев описывают время никак не ранее восьмого века (у норвежцев вообще мало что сохранилось, у них христианизация произошла раньше и не так мирно, как в Исландии, так что рукописей поуничтожали много), и описывают они в основном не мифологическую историю, а реальные (или считающиеся таковыми) истории конкретных людей и родов. Мифология там только в "Эддах" (Старшей и Младшей, 12-13 века), в первой главе "Круга Земного" ("Сага об Инглингах"), в "Саге о Вёльсунгах" и в том, что называется "саги о древних временах", или "фантастические саги" (полусказочные повествования, большинство из которых на русский язык не переводились, по-английски я их тоже не нашла, прямо хоть учи древнеисландский). Так что сведений крайне мало, многие из них противоречивы, и строить предположения на тему "откуда он взялся" можно только на основании <nobr>оч-ч-чень</nobr> косвенных данных.

А можно, я лучше после выходных на эту тему повысказываюсь? Уж больно сейчас времени мало, другими делами заняться нужно бы... А вы можете детализовать, что именно вам о нем нужно услышать? А то вдруг я развысказываюсь, а вам нужно что-нибудь в другом разрезе...

"Ворон вместо глаза" – это у вас, конечно, "два в одном"; у него наблюдалось отдельно отсутствие глаза и отдельно присутствие спутников-воронов в количестве двух штук: Хугин (переводится как "думающий") и Мунин ("помнящий"), обычно изображались сидящими или на плечах Одина, или на спинке его трона. Ну или на спине коня. Мог изображаться и один ворон, без второго. Но ворон как непременный атрибут присутствовал, как и волки, которых тоже было два: Гери ("жадный") и Фреки ("прожорливый"). О волках как-то данных не сохранилось (кроме того, что они сидят у трона Одина, и он им скармливает мясо со своего стола, потому что сам ни на каких пирах не ест, а только вино пригубливает), а вот вороны - личности замечательные: им открыт доступ во все девять миров, они летают по ним и собирают сведения, где что происходит, а потом хозяину эти вести приносят.

Предварительное такое заявление: просто фольклорным персонажем он быть никак не может. Не выходили иванушки-дурачки и бабы-яги в верховные боги, тем более так, чтобы это был чуть ли не единственный случай в описанной мифологии, когда верховным богом становится бог, позже всех вошедший в пантеон, да еще не просто бог войны (такие там были и до Одина, у Тора и Тюра были воинские функции), а бог - предводитель военной дружины, которую сам же для себя специально подбирал, предварительно создав для нее отдельное небесное жилище - Вальгаллу, рай для павших воинов.

В общем, вы мне лучше скажите, какой сегмент этой темы вас больше интересует, иначе я просто рискую написать трактат, который, может быть, никому и не пригодится...

Ответить на это сообщение
 
 от оффтопика к удовлетворению
Автор: Психолингвист 
Дата:   15-02-02 01:34

Позволю себе напомнить участникам этого треда, что тема заявлена как "речевые полиграфы". А темы про древнего О-о-о-дина лично у меня вызывают упомянутое уже multiply personality dosorder. появляются мысли про реинкарнацию, пренатальное и праязыковое.
Поэтому, если вернуться к основной теме, то хотелось бы знать о том, как бы системе (вот как ее назвать, пока не знаю) реагировать вежливо на непонятное, на грубое, на оффтопикное. И как уметь менять тему на то, что является конечной целью диалога. (оказать клиенту услугу, о которой он мечтает, удовлетворить его потребность). И как узнать, не блефует ли клиент, (грубо говоря. есть ли у него башли) не раздражен ли он, не в депрессии ли он?
Более широко: стОит ли вводить эмоциональную составляющую в условиях а) инокультурности реципиентов (о нац-тях таксистов см. выше) и б) их прагматичности. Не будет ли это вторжение в прайваси, которой всё меньше? И как быть вежливым, но настойчивым (не agressive, а assertive)?

Ответить на это сообщение
 
 Re: ещё раз о лаконичных вопросах :)
Автор: Юлия Зайцева 
Дата:   15-02-02 17:54

Ух!.. Здоровский набор тезисов для диссертации на тему искусственного интеллекта :) Попробую отвечать кратко и по порядку.

> как бы системе (вот как ее назвать, пока не знаю)
> реагировать вежливо на непонятное, на грубое, на оффтопикное.

Очень просто. Не вводить в состав ответных фраз грубости и тактично менять темы при встрече с непонятным и оффтопикным.

> И как уметь менять тему на то, что является конечной целью
> диалога. (оказать клиенту услугу, о которой он мечтает,
> удовлетворить его потребность).

При недостатке данных для анализа введённого текста выбирать из таблицы фразы, относящиеся к услугам, случайным образом или с привязкой к предыдущим фразам; стараться по возможности использовать заранее заготовленные общие фразы типа "Я бы рад поболтать с тобой о <цитата из фразы клиента>, но я на работе, а мой босс обещал срезать мне половину стэка, если заметит, что я говорю не о тачках. Кстати, не хотел бы ты поговорить именно о них?". Можно встроить в ответные фразы элементы НЛП.

>И как узнать, не блефует ли
> клиент, (грубо говоря. есть ли у него башли) не раздражен ли
> он, не в депрессии ли он?
Вопрос о блефе и башлях - одна из главных проблем бизнеса. Вряд ли её удастся решить в рамках программы чатбота. Для этого следовало бы создать пресловутый текстовой полиграф, но это уже немного другая задача. О депрессии могут свидетельствовать определённые слова или сочетания слов, встречающиеся в тексте. Можно отдельно вести статистику принадлежности слов данного клиента к различным группам, тем самым пытаясь определить его общий настрой по совокупности этих данных, хотя при таких объёмах информации это, наверное, не шибко эффективно. Прошу прощения, я не чувствую себя достаточно компетентной в психолингвистике, чтобы сформулировать эту мысль точнее.

> Более широко: стОит ли вводить эмоциональную составляющую в
> условиях а) инокультурности реципиентов (о нац-тях таксистов
> см. выше) и б) их прагматичности. Не будет ли это вторжение в
> прайваси, которой всё меньше? И как быть вежливым, но
> настойчивым (не agressive, а assertive)?

Эмоциональную составляющую вводить надо. Хотя бы для того чтобы определить степени грубости и экспрессии предполагаемого ответа. С инокультурностью клиентов придётся просто мириться. БОльшая проблема связана с иноязычностью: контроль грамматических ошибок и т.д. Но многого тут сделать просто нельзя. Вторжением в частную жизнь это не будет, поскольку от клиента не требуется выдавать частные сведения, а разговор начинает он, а не порграмма.
О вежливости и настойчивости в английском языке - вопрос к Ирине. Ирина, не могли бы вы прикинуть с десяток фраз, коими подобает приличному компьютеру склонять человека к покупке раздолбанной и выработавшей 10 своих ресурсов списанной полицейской тачки? :)

PS Ирина, извините, что заставила вас тратить время на мои идиотские вопросы. По части глупостей я эксперт, так что впредь, если мой вопрос покажется вам идиотским, просто говорите мне об этом :) На самом деле мне просто был любопытен ход мысли, который привёл создателей этого мифа к такому сложному и колоритному образу. Возможно, у него были какие-то предки в иных культурах и эпосах. Как-то не верится, что этот персонаж мог возникнуть в результате работы "испорченного телефона" устных народных преданий, как это происходит у современных северных народов, и "задокуметирован" уже по факту.

Ответить на это сообщение
 
 Ну вот и я, только ненадолго...
Автор: Ирина 
Дата:   21-02-02 17:25

Пардон за долгое отсутствие: обстоятельства-с...

1) Юля! Бога ради, о чем вы? Извиняться вам совершенно не в чем, и уж вовсе преступно обзывать глупостью нормальное человеческое желание разобраться в непонятном, тем более когда есть кого об этом непонятном спросить. Вопрос о происхождении Одина вполне закономерен, и из всех, кого я знаю, вы единственный человек, который сформулировал его так глубоко и одновременно лаконично (я не об "откуда он взялся", а о "ходе мысли, приведшем к созданию"). К сожалению, сейчас совершенно нет никакой возможности продолжать "лекцию" (у домашнего компьютера монитор не включается, нужно что-то делать, а дома еще и ремонт), но при первой же возможности обязательно засяду за "трактат" - и мне самой будет полезно мысли упорядочить. Так что "продолжение следует". Надеюсь.

2) Об изданиях Корана с комментариями Саади мои знакомые не слышали, но сами очень заинтересовались и сказали, что будут выяснять. Им известно, что какое-то научное издание Корана готовится, но вот какое и где - они не знают. А известие об издании датчан оказалось несколько преждевременным: не издали, но готовятся. Но в каком издательстве - тоже не знают. Так что, Юля, ежели вдруг что прослышите - уж свистните мне, пожалуйста!.. А Фому Аквинского издали в переводе Бибикина под редакцией Аверинцева, тираж 1100 экземпляров. Собираются издавать еще, но в переводе конца 19-го века, в одном томе и с купюрами.

3) По поводу "десятка фраз", коими приличный компьютер должен склонять клиента к покупке: вы мне хоть контекст-то какой-нибудь дайте!.. Потому что абсолютно универсальна (в смысле отвлекания клиента от посторонних разговоров) только фраза "You've come here for a car, haven't you?" и ее близнецы-братья типа "Sure you need a car?". В каких ситуациях этими фразами реагировать? Когда клиент отвлекается, когда он невнятен, когда он агрессивен? Или просто "на входе" - " ну вот и ты, а я тут в машинки играю"...

Мне тут вот что подумалось. Если при создании барышни мы решили делать упор не на формы тела, а на профессию, то подход может быть и таким: на упоминание клиентом желаемой марки барышня реагирует восклицанием типа "Ah, it's Bill's!" и рассказывает какую-нибудь байку про то, как сержант Билл Джонсон неделю назад выжал из этой машины 88888 миль в час, каковым подвигом добыл $99999, похищенные нехорошими грабителями у добропорядочного гражданина (только при этом не упоминать о трупах, наркотиках, проститутках, маньяках и прочих приятных вещах, которые в этой машине могли перевозить). Ну чтобы клиенту захотелось тут же в машину сесть и догнать кого-нибудь с такой же суммой. Только предварительно вместо "мальчик-девочка" выяснить у клиента, что он больше ценит в машинах: надежность, скорость (что там еще бывает у машин - устойчивость краски? неоторванность дверей? неразбитость фар?) и в зависимости от этого подбирать байку. Если даже и не рассказывать баек, то запросто можно упоминать машины как принадлежавшие конкретным полицейским - упоминавшееся недоверие к продавцам машин слегка перекроется в клиентских ощущениях законопослушническим инстинктом.

По поводу того, что сами мы собираемся разговаривать много, а окошко для клиентских реплик Психолингвист предложил делать маленьким: а у клиента от этого никакого дискомфорту не случится?

И еще о намерении по четыре раза переспрашивать "другими словами" и "еще раз", если клиент был не сразу внятен: может, это как-то по-другому делать? Ну представьте себе, что клиент просто не знает, как пишется слово, и делает в нем одну и ту же ошибку. И четыре раза подряд. Я бы уже после второй просьбы (какой угодно вежливой) "сказать другими словами" плюнула и ушла на другой сайт, где нет барышни (которая у вас все равно асексуальна, и непонятливость выглядит тупостью, а не завлекательным приемом), зато есть сразу вся информация о машинах.

...Юля, а продолжение программистских лекций будет? Понемножку, а?..

Ответить на это сообщение
 
 Завершение с продолжением
Автор: Психолингвист 
Дата:   21-02-02 22:46

Спасибо всем участникам этой темы. Думаю, мы превысили все допустимые объемы для обсуждения. Рекорд, однако.
Поэтому есть предложение: перенести продолжение в плоскость личных переписок еще и потому, что мы выходим на конкретику, которая может быть ноу-хау. А поскольку для меня это еще и коммерческий заказ, я действительно думаю, что кто-нибудь может создать подобное. Не сейчас, и не здесь, но в принципе. Конкуренты появятся, в этом я не сомневаюсь. Есть очень серьёзные фирмы, которые этим занимаются.
Поэтому, уходя из этого обсуждения, буду сюда периодически заглядывать с тем, чтобы посмотреть, не хочет ли кто поучаствовать в проекте.
К примеру, "Посторонний" интересовался, но адреса не оставил. Оставьте свой адрес или найдите меня в инете (я как минимум на 4 рос. и 3 имп. сайтах засвечен:).
Успеха всем. О результатах обещаю доложить.
Приглашаю к сотрудничеству всех, кому близки заявленные проблемы: полиграф (детектор лжи/правды), speech recognition (распознавание и генерирование речи), компьютерный анализ текста (типа ВААЛа), моделирование диалога, суггестия в условиях инетного общения, в целом интерактивные системы общения.
Желательно со знанием английского.
Пишите!

Ответить на это сообщение
 
 Re: Завершение с продолжением
Автор: Владимир М. 
Дата:   12-02-04 17:31

Здравствуйте, господа!
Очень интересная фраза:
"д) а менты на этот Краснодар молятся: школа, мол, у них; а книжку эту, которая Кр.-2000, за библию почитают.
е) здорово! а в МВД говорят, что это всё туфта да бирюльки…"
Дело в том, что я служил в ГУВД Краснодарского края, в подразделении, которое применяет полиграф на практике. Учил психологов и оперов работать с компьютером, чтобы они умели потом работать с полиграфом :-), знаком с обоими Варламовыми.
А что, разве в Краснодаре нет школы?
Книжка Кр.-2000 - это видимо первая книга В. А. Варламова "Детекция лжи"?
И почему же это "туфта и бирюльки"? Тысячи проведенных полиграфных проверок при раскрытии преступлений и приеме сотрудников на службу ...

Ответить на это сообщение
 форумы  |  свернуть  |  начало  |  к началу   назад  |  вперед