Грамота.Ру
ГРАМОТА СЛОВАРИ СПРАВКА НАВИГАТОР КЛАСС ИГРА Версия для мобильных устройств
Конференции Новости Журнал Конкурсы Олимпиады Форум Поиск О портале


Вече
 форумы  |  новая тема  |  начало  |  к началу  |  поиск  |  войти   назад  |  вперед 
 По результатам исследований...
Автор: GraveD 
Дата:   16-09-03 14:32

По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужЮ бкуву по отдльенотси, а все солво цликеом.

===

Я так и не понял, хохма это или всерьёз? Текст на самом деле читается без проблем! :)

Ответить на это сообщение
 
 eot kharahso
Автор: Perry Stroika 
Дата:   16-09-03 16:12

eot ohce'n kharahso i itnernso :-)

Ответить на это сообщение
 
 Перестановки букв в словах
Автор: IF 
Дата:   16-09-03 18:22

Конечно, читается, но не быстро. Лучше уж писать нормально.
Если кому-то интересно, предлагаю файл в Экселе - перестановки букв в словах из 4-7 букв. См. ftp.natm.ru/IncomingXXI/Docs.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: UPS 
Дата:   17-09-03 01:19

А текст-то и впрямь читается без всяких проблем!! Но дело, кажется, отнюдь не только в первых и последних буквах (тем более, что и они бывают перепутаны), а - в первую очередь - в контексте.

Ответить на это сообщение
 
 Тут оригинал на буржуйском
Автор: Арнольд 
Дата:   17-09-03 12:05

http://science.slashdot.org/science/03/09/14/2031255.shtml?tid=126&tid=134
Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy, it deosn't mttaer in waht oredr the ltteers in a wrod are, the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae. The rset can be a total mses and you can sitll raed it wouthit porbelm. Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe.

Хочу сказать, что методика "смешивания" не нова.
Тут можно почитать, как выполнена одна из интересных реализаций поиска в массиве слов по заданным буквам (с автором я знаком лично):
http://www.multitran.ru/c/m.exe?HelpLanguage=Russian&MtsrvAction=SearchLettersModel

Ответить на это сообщение
 
 А в чём хохма-то?
Автор: Ilyich the Toad 
Дата:   17-09-03 13:01

Пардон, а после какого слова надо смеяться? Во-первых, буквы-то расположены вовсе не в полном беспорядке. Увы, я не в состоянии обнаружить оригинальную публикацию неизвестных исследователей этого самого камбражского университета. Наблюдаю только никуда не ведущие обломки, так что буду комментировать именно их: отсутствует малейшая попытка вычислить длину "перестановки" в примере. Об определениии читаемости, как зависимости от означенной длины, я и говорить не буду. Короче, фуфло голимое ;-)

Ну, а во-вторых, читается-то с большими затруднениями. Если кто сомневается - пусть попробует прочесть вслух, с выражением, гладко, и за минимальное время.

Так что я, честно говоря, так и не понял, где смеяться. Типа народ в очередной раз открыл помехоустойчивость языка, происходящую из его избыточности? Ну, поздравляем. Вообще-то я ещё в советские времена такую байку слышал, что партизаны отряда Ковпака намеренно вносили в свои сообщения ошибки примерно такого типа (плюс меняли "о" на "а", писали "жы\щы" время от времени, рвали слова на куски и слепляли оные, ка кпоап ла, и т.д.), чтоб фашикам жизнь малиной не казалась ;-) Не знаю, верна ли байка - за что купил, за то и продаю - ну звучит красиво, согласитесь.

Ответить на это сообщение
 
 Re: А в чём хохма-то?
Автор: GraveD 
Дата:   17-09-03 13:13

Соль тут в том, что большинство оправшиваемых читает весь текст без проблем, понимает каждое слово, а многие даже не сразу замечали перестановку букв, которая тем не менее имеет место. Например, один мой приятель понял, что порядок букв изменён только когда дочитал текст до конца и вдумался в его смысл.

Мне, да и судя по реакции народа, не только мне, сей факт кажется необычным и весьма интересным.

Ответить на это сообщение
 
 А узнали, что всю жизнь прозой говорят :) (-)
Автор: Р.Г. 
Дата:   17-09-03 13:27

-

Ответить на это сообщение
 
 И тем не менее
Автор: Ilyich the Toad 
Дата:   17-09-03 13:49

GraveD сказал:
>
> Соль тут в том, что большинство оправшиваемых читает весь
> текст без проблем, понимает каждое слово, а многие даже не
> сразу замечали перестановку букв, которая тем не менее имеет
> место. Например, один мой приятель понял, что порядок букв
> изменён только когда дочитал текст до конца и вдумался в его
> смысл.

И тем не менее, я намерен возражать против понятий "большинство", "без проблем" и "многие". Сперва надобно видеть деньги. Т.е. методики и результаты. А приятелю вашему, может, стоит обратиться к окулисту, или просто перестать посещать хакерские форумы? Не в обиду будь...

И ещё раз повторю - подстановка-то идёт с радиусом много меньше длины слова. Это даже я вижу. Ну, перекинули местами две соседних буковки, эка невидаль. А вы вот соберите сначала все гласные, потом все согласные, в алфавитном порядке. И дайте вашему приятелю. Пусть выйдет, пусть вынет свой, хе-хе, кортик - и я, хоть и на одной ноге...

> Мне, да и судя по реакции народа, не только мне, сей факт
> кажется необычным и весьма интересным.

Вам надо учителем русского языка в среднюю школу пойти - вы такого насмотритесь... Будет вам и необычное, будет и весьма интересное. И, главное, мно-о-о-ого! ;-)))

Ответить на это сообщение
 
 Re: И тем не менее
Автор: GraveD 
Дата:   17-09-03 13:59

Ilyich the Toad сказал:
>
> И тем не менее, я намерен возражать против понятий
> "большинство", "без проблем" и "многие". Сперва надобно

Да бога ради! Я опубликовал интересную на мой взгляд информацию. Большинство -- статистическое. Многие -- из опрошенных мною. Все, кроме вас :)

Ставлю пометки:

-не для учителей русского языка! :)
-не для IT.
-в дискуссии вступать не намерен!

С уважением.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: adada 
Дата:   17-09-03 15:30

"Фикобилины фикоэритринов называются фикохритробилинами, а фикобилины фикоцианинов -- фикоцианобилинами".
"Имеются основания полагать, что карапакс у эвмалокострак отсутствовал, что говорит против происхождения эвмалокострак как от филлокарид, так и от каридоидов".
(Цит по: В.М.Мокиенко. Образы русской речи. Л. 1986, с.65)

Мы не умеем и не рискнем, переставьте буквы сами, посмотрим, что беудт...

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: mathusael 
Дата:   17-09-03 15:53

Н-да, а я принадлежу к упомянутому большинству. Текст читаю без всякого труда. На английском варианте споткнулся только на слове "mess". Сомнения обуяли - ожидал слова "miss", и секунд несколько размышлял, нет ли опечатки.

++++ Ilyich the Toad сказал ++++
>>> И ещё раз повторю - подстановка-то идёт с радиусом много меньше длины слова.

Да, именно так, кто спорит. Если уж быть буквоедом - то фразу, конечно, следует скорректировать, добваив пнкут о преетснаокве тлокьо билкзих бкув. Но суть-то не изменится. Большинство публики не обращают внимание на порядок букв в слове. Я это давно подозревал. Просто есть два типа людей.

Первые, их судя по всему - большинство, к ним я отношу себя, верят не глазам а мозгу. "Я вижу то, что понимаю". Было когда-то давно такое исследование. Людям разных профессий давали на распознавание слова типа "оптека". (примеров точно не помню, этот известен по разным книгам). Первая реакция опрашиваемых позволяла однозначно отличить фармацевта от окулиста. Тоже самое происходит у таких людей при чтении. Слова воспринимаются "целиком", как иероглифы, мелкие ошибеночки типа перестановки букв не влияют на распознавание.

Вторые, к которым, вероятно, может отнести себя уважаемый Жаб, воспринимают информацию дискретно-последовательно. Эти больше доверят глазам и "понимают то, что видят", у них перестановки букв вызывают бОьшие затруднения, поэтому и сами они пишут обычно с меньшим количеством ошибок. Из них, наверное, - должны получаться хорошие лингвисты, а из первых - программисты. (;0))))))

А что касается выявления степени затруднения распознавания, как функции от средней длины перестановки, то "вопрос, конечно, интересный...". Да, в научном трактате без него, не обойтись. Но приведенный пример, насколько понял, сам по себе не претендует на серьезный научный уровень. Максимум на научно-популярный.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: mathusael 
Дата:   17-09-03 16:25

2adada
Для тех, кто с этими хитрокастраками не каждый день сталкиватся результат от перестановки слагаемых не изменится по той причине, что для них оба варианта абсолютно нечитаемы. Для тех же кто без этих цианокарапаксей жить не может, перстановка букв опять-таки мало что изменит, поскольку они поймут о чем речь по первым буквам. Неужели же Вы полагаете, что специалисты вчитываются в каждую букву привычного им термина?

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   17-09-03 16:51

Н.т, п.-....у, п....е и п.......е б...ы т.т ни п.и ч.м, в с......е в.ё же н..о бы ч..-.о и...ь...

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: GraveD 
Дата:   17-09-03 16:54

Можно последнее слово полностью? :) Кстати, интересно... Зная контекст и первые буквы, я понял почти всё, что написал Dend...

Ответить на это сообщение
 
 методика восстановления
Автор: Психолингвист 
Дата:   17-09-03 17:34

Была такая методика восстановления в годы войны: буквы пропускать в словах, но чтоб переставлять - не было. так что результат нов. и самое главное, приколен. на афатиках, что ли тренировались?

Ответить на это сообщение
 
 2 "mathusael"
Автор: adada 
Дата:   17-09-03 18:25

--------------------------------------:)

Ответить на это сообщение
 
 Термины
Автор: Ilyich the Toad 
Дата:   17-09-03 22:32

mathusael сказал:
>
> Для тех же кто без этих цианокарапаксей жить не может,
> перстановка букв опять-таки мало что изменит, поскольку они
> поймут о чем речь по первым буквам. Неужели же Вы полагаете,
> что специалисты вчитываются в каждую букву привычного им
> термина?

Ну уж извините. Неужели вы всерьёз полагаете, что все специальные термины настолько избыточны? Вот, например, систематические химические названия (а один из предложенных примеров имел химические корни) могут начисто поменять смысл от изменения одной буквы (про цифры уж и говорить не стоит). Такие штуки вообще В ПРИНЦИПЕ нельзя валить в одну кучу с разговорным языком - они конструируются по вполне чётким, абсолютно логичным правилам. Без малейших исключений. И притом по правилам достаточно интернациональным. В отличие от.

Ответить на это сообщение
 
 Ну, уломали бы, если б не
Автор: Ilyich the Toad 
Дата:   17-09-03 22:50

Ну ладно, вы бы меня уломали, убедили бы в том, что я - единственный экземпляр сапиенса сапиенса, обращающий внимание на текст ;-) Вот одно (одно из) мне мешает: все дружно говорят, что "читают без проблем". А какие проблемы имеются ввиду? Скажем, я тоже понимаю смысл "без проблем". Но вот читаю предложенные примеры примерно вдвое медленнее (речь, конечно, не идёт о пассаже Dend'а. Это - отдельная мигрень в пониже спины, там зартаты времени больше уже на порядок), и для меня это - проблема. Самая настоящая. Может быть, у нас разное понимание "проблем"?

И, опять же, элементов "научной новизны" я не наблюдаю. Неужели я единственный, кому приходилось выслушивать кошмарные диалекты и акценты, читать вопиюще безграмотный текст, и стараться реконструировать смысл? Я подозревал, что ВСЕ люди именно этим и занимаются почти ежедневно, и уже не первую тысячу лет. Что тут такого оригинального-то? Ну, прикол, бесспорно, Ну, типа, все уже посмеялись. Но рассматривать подобное на полном серьёзе - уж извините.

Ответить на это сообщение
 
 Re: Ну, уломали бы, если б не
Автор: Сергей Г. 
Дата:   18-09-03 00:18

Ilyich the Toad
>>>>я - единственный экземпляр сапиенса сапиенса, обращающий внимание на текст

Нет, Вы не в одиночестве. Я такой же.

Ответить на это сообщение
 
 Re: Термины
Автор: mathusael 
Дата:   18-09-03 09:04

2Ilyich
>>> Неужели вы всерьёз полагаете, что все специальные термины настолько избыточны?
Вы о какой избыточности говорите? О терминологической не здесь и не со мной говорить. А фонетическая и, соответственно, графемная избыточность здесь налицо. Замените сочетание "фито" на "Ф-" и что, хуже станет?

>>> Скажем, я тоже понимаю смысл "без проблем". Но вот читаю предложенные примеры примерно вдвое медленнее
Я именно об этих проблемах и говорил. Практически не заметил разницы в скорости чтения. О неправильности написания русского текста понял где-то на "середине дистанции". Поэтому на какое-то время и затормозил, пытаясь понять, что это у меня с глазами. Английский вариант читал уже "подготовленным", так что вообще никаких проблем за исключением упомянутого "mess" не имел.

Кстати, я вообще отношусь к скорочтежкам. При "легком" чтении на страницу обычной книги (для особо дотошливых - 40-50 строк по 60-80 знаков нормальной книжной гарнитуры 8-го кегля) уходит обычно от 40 сек до минуты, максимум минуты с четверьтью. Последнее если приходиться продираться через частокол полузнакомых слов. Насколько знаю, это довольно быстро. "Усвояемость" не проверял, не знаю, как оценить. Говорю не для того, чтобы похвастаться, просто подозреваю, что есть серьезная корелляция между скоростью чтения и наплевательским отношением к порядку следования букв.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   18-09-03 09:28

2 Ilyich the Toad
+++ вычислить длину "перестановки" +++
+++ подстановка-то идёт с радиусом много меньше длины слова +++
Из занудства даю справку: эта штука называется "редакторской метрикой" ("расстоянием редактирования"), "расстоянием Левенштейна" или "метрикой Хемминга". Это все различные способы подсчета.

[quote]
Для сравнения строк обычно используют метрики, оценивающие максимальную стоимость преобразования одной строки в другую. В общем случае, операциям редактирования, используемым в этом преобразовании, а именно замене символов, их вставке и удалению, можно назначить разные цены. Последние две операции иногда объединяют в одну и называют вставуд (indel; от insertion и deletion).

Расстояние Хемминга [Hamming, 1982] между двумя строками одинаковой длины определяется как число позиций, в которых символы не совпадают. Это эквивалентно минимальной цене преобразования первой строки во вторую в случае, когда разрешена только операция замены с единичным весом. Если допускается сравнение строк разной длины, то, как правило, требуются также вставка и удаление.

Если придать им тот же вес, что и замене, минимальная общая цена преобразования будет равна одной из метрик, предложенных Левенштейном [Levenstein, 1965]. Другая метрика равна минимальной цене преобразования в случае, когда разрешены только вставка и удаление. Это эквивалентно назначению цены 1 удалению и вставке, и 2 замене, так как последнюю можно заменить парой вставка-удаление. Первую из этих метрик мы ниже называем расстоянием Левенштейна, а вторую – расстоянием редактирования.
[/quote]

http://algolist.manual.ru/search/lcs/index.php

Ответить на это сообщение
 
 Re: Ну, уломали бы, если б не
Автор: mathusael 
Дата:   18-09-03 09:29

>>>Ilyich the Toad
>>>>>>>я - единственный экземпляр сапиенса сапиенса, обращающий внимание на текст

>>>Нет, Вы не в одиночестве. Я такой же.

Ну вот, вас уже две особи. Порода не вымрет. ;0)))

Не знаю, чьи именно слова были восприняты как уверение в исключительности Жаба. Я хотел сказать о существовании и тех и других. Просто первых больше. Сейчас с меня потребут методику подсчета, у меня ее нету. Но есть отмазка в виде контрвопроса - "А каким образом подсчитали соотношение правшей и левшей?". Последних, кстати, их меньшинство совсем не задевает. Наоборот, они уверены, что процент гениев среди них гораздо выше. Я подозреваю, что так оно и есть, хотя сам - правша.

Ответить на это сообщение
 
 ну просто из занудства
Автор: mathusael 
Дата:   18-09-03 09:35

Арнольд сказал:
> Если
> допускается сравнение строк разной длины, то, как правило,
> требуются также вставка и удаление.

Вы можете указать на исключения из этого "правила"?

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: mathusael 
Дата:   18-09-03 09:46

2GraveD
Поскольку Dend пока молчит, смею предположить, что последнее слово "иметь". Я споткнулся на предпоследнем. Возможно правильно было бы "в с......и". Тогда текст расшифровывается без труда. Но опять-таки, это некоторая подмена понятий. Мы же говорим не об отсутствии "внутренних" букв вообще, а об их неправильном положении в слове, причем "не очень далеком" от правильного.

Ответить на это сообщение
 
 И из еще бОльшего занудства
Автор: mathusael 
Дата:   18-09-03 10:18

2 Арнольд
А ведь предложенные Вами метрики не подходят... В них, насколько знаю, допустимы любые перестановки. Для вычисления "средней длины" перестановки (о которой, насколько понял, говорил Ильич) надо определять не количество таких перестановок и/или замен, а среднее растояние от положения буквы в искаженном слове до ее истинной позиции. С какой-то натяжкой это можно реализавать введя метрику минимального числа перестановок соседних букв или вводя различный вес перестановок разной "длины". О натяжке я упомянул, например, из-за слов с одинаковыми буквами.

Я, впрочем, полагаю, что помимо средней длины перестановки (в понимании Ильича) не менее, если не более, важными факторами распознавания являются: а) число пар букв, сохранивших правильный порядок взаимный порядок следования б) число пар соседних букв сохранивших соседство после перестановки, причем с бОльшим весом для случая, когда порядок следования сохранен Т.е. "идеальная" метрика должна была бы учитывать "с минусом" и число упомянутых пар. Не думаю, что такое возможно, очень уж проблематичным становится подбор весов для всех этих факторов и обоснование аксиомы треугольника (m(a,b)+m(b,c)>=m(а,c)).

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: GraveD 
Дата:   18-09-03 10:22

Ну, Dend просто пошёл дальше :) C "иметь" соглашусь :) Просто не подумал, что в конце может быть многоточие :)

Ответить на это сообщение
 
 Вы - не единственный.
Автор: Р.Г. 
Дата:   18-09-03 10:42

Просто лень обсуждать тривиальщину.
Обыкновеннейшая передача информации с помехами. Ну, наделали не просто опечаток, а опечаток по определённой системе - и только-то.

Ещё в детсаду, помнится, развлекались аналогично, только система искажения текста была несколько другая:

"Тея тебете поте шете ете дамте!"

При минимальной тренировке в таком духе можно говорить очень быстро, а непривычному уху (воспитателя, напр.) - чистая тарабарщина.

Вспомним также Муми-тролля, разговор Топслы и Вифслы...

("Мысла тутсла присла шлисла...")

Блажен, кому всё ново под Луной, нехай порадуются :(...

Ответить на это сообщение
 
 Re: Ну, уломали бы, если б не
Автор: GraveD 
Дата:   18-09-03 11:04

Я, кстати, не говорил, что не обращаю внимания. У меня привычка читать текст внимательно и замечать ошибки. Сразу заметил перестановку букв и попросту от ошибок абстрагировался. Получилось прочитать довольно быстро и легко.

А потом ради интереса попробовал прочесть быстрым способом -- так, как читаю технические тексты или те, где нужно понять общий смысл, но не обязательно вникать в слова. И вот тут результат меня позабавил -- текст читался практически так же, как нормальный (без перестановок).

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   18-09-03 12:34

2 mathusael
>> Если
>> допускается сравнение строк разной длины, то, как правило,
>> требуются также вставка и удаление.
>Вы можете указать на исключения из этого "правила"?
Не я автор отквоченного текста. Но... да, могу, если под операцией сравнения подразумевать равенство строк до минимальной их длины. При этом пустая строка равна любой наперёд заданной :)
В каких-то ЯП я видел такого рода операции... DBASE, что ли, или Clipper (SET EXACT OFF).

>А ведь предложенные Вами метрики не подходят...
Ну да, для предложенного текста это не совсем то.
Можно предложить метрику mathusael'а (с).
Если один n-кортеж можно простой перестановкой элементов преобразовать в другой, то определим метрику "eдиничного расстояния перестановки" как количество знакомест между двумя попарно переставляемыми элементами (1...n-1).
Тогда "расстоянием перестановки" назовём сумму метрик единичных последовательных перестановок.
Метрикой mathusael'а m(x, y) назовём минимальную среди вариантов таких последовательностей.
Например, "место" и "мстео" имеют метрику 1, "место" и "мстое" - 2 и т.д.
Далее можно ввести "модифицированную метрику" m'(x,y) для того, чтобы взвешивать перестановки. Большие веса от начала - для индоевропейских, от конца - для семитских языков, сверху вниз - для японского. :)
Предложить алгоритм вычисления метрики (который доброхоты, как водится, тут же улучшат, повбивал бы).
Дальше показать, что средняя скорость распознавания текста обратно пропорциональна суммарной модифицированной m-метрике.
Придумать, зачем это нужно.
К Мафусаиловым годам можно и защититься :)

Ох, как прав Экклесиаст, вслед за Р.Г. говоривший, что ничто не ново (только под солнцем)...

Ответить на это сообщение
 
 Re: 2 "mathusael"
Автор: mathusael 
Дата:   18-09-03 12:56

2Арнольд
>>>> Но... да, могу, если под операцией сравнения подразумевать равенство строк до минимальной их длины. При этом пустая строка равна любой наперёд заданной :)
И тем самым нарушает все условия на метрику ;(((((
(кроме первого - равенства самому себе, вылетело из головы, как он там называется).

То, что Вы написали, для метрики, в принципе, подходит. А вот на "зачем это нужно?...". Наверное сама по себе проблема не многого стоит, но если обобщить... Нуежели никому не интересны принципы по которым человек распознает поступающую текстовую информацию?

>>> К Мафусаиловым годам можно и защититься :)
Не, я не про себя, я действительно уже приблизился к тому возрасту (отсюда и ник), так что не успею. ;0)))

Ответить на это сообщение
 
 До кучи
Автор: Ilyich the Toad 
Дата:   18-09-03 12:57

Ну что же, приступим:

О скорочтении: вот, кстати, вертелось у меня на языке предложение проверить этот текст на "скорочтецах" и нормальных людях раздельно. И был я уверен, что "скорочтецы" поимеют меньше проблем. Просто был я прям с поезда и дико хотел спать, так что формулировать поленился ;-)

Дело в том, что, по моим личным наблюдениям, все (по крайней мере, все мною встреченные) методики скорочтения направлены на игнорирование деталей. Именно по этой причине я сознательно отказался от попыток овладеть скорочтением, о чём не жалею. Для меня скорочтение - немыслимое насилие над культурой текста, от редактуры до вёрстки и даже до шрифтового дизайна. Я такого терпеть не могу. Для меня это - то же самое, что выдавать "точка, точка, два крючочка" за точную копию автопортрета Ван Гога. Я желаю видеть текст аккуратным, ласкающим глаз и всё, что позади глаза в черепе находится. И любые предложения не обращать внимания на дефекты считаю личным оскорблением ;-)

Р.Г.:
>Просто лень обсуждать тривиальщину.
>Обыкновеннейшая передача информации с помехами.

Ну, бальзам на душу ;-) Я тоже не понимаю, почему никого не удивляет то обстоятельство, что слегка дефектные архивы всё же раскрываются, слегка поцарапанные CD читаются, военные системы связи не инициируют ракетных атак даже при ударе молнии рядом с антенной, и т.д. и т.п.; а вот то обстоятельство, что язык, развивавшийся чёрт его знает сколько лет в условиях наличия колоссального количества картавых, шепелявых, малограмотных и криворуких носителей, обладает устойчивостью к помехам - почему-то вдруг удивляет. А чего же иного, простите, от языка ожидать-то можно? Что от однобитовой ошибки посыплются три страницы текста? Простите, но такой язык в принципе существовать не может.

Любителям же "новых" результатов могу предложить ещё несколько: например, на смазанных, плохо сфокусированных или диффузных фотографиях знакомые лица успешно распознаются, причём практически независимо от мимики. Ну чем не тема для сенсации!

Что касается метрик и занудства: Арнольд явно меня понял ;-) Ну, ещё можно пытаться раскладывать длинные перестановки на конечное число коротких. Я, правда, не знаю, зачем ;-) Пусть этим авторы оригинальной публикации занимаются, а у меня и конкретных практически важных проблем по горло.

>>>> Неужели вы всерьёз полагаете, что все специальные термины настолько избыточны?
>Вы о какой избыточности говорите? О терминологической не здесь и не со мной говорить. А фонетическая и, соответственно, графемная избыточность здесь налицо. Замените сочетание "фито" на "Ф-" и что, хуже станет?

...а всё потому, что названия используются не то тривиальные, не то рациональные. Скорее рациональные. Ну да не суть. Суть в том, что не систематические.

Ответить на это сообщение
 
 Прикладное значение (дались нам перестановки!)
Автор: Р.Г. 
Дата:   18-09-03 13:15

А вот если опечатки формировать не перестановкой, а заменой - можно получить результат если не более удивительный, то практичный однозначно (проверено на себе).

Можно рассматривать - и без особого труда (и деталей-тонкостей, конечно) понимать текст на иностранном, но родственном языке, как русский текст с помехами.

Именно так я чисто интуитивно научился читать по-польски во времена, когда достать Лема в переводе было невозможно, а в оригинале в "Книгах стран социализма" на ул. Горького ака Тверской - запросто.

Всего лишь надо было запомнить буквально несколько правил замены звуков - и практически всё сранно звучащее становилось родным и понятным как украинский уроженцу Кубани.

Например, ихнее "ж" - это когдатошний славянский звук, у нас перешедший в наше "р", оно и на письме как "rz" идёт - и сразу непонятные "жека" и "ожел" переходят в "река" и "орёл", и т.п. Через десяток страниц это идёт на автомате, читаешь почти как по-русски, только помедленнее, конечно.
-------------------------
А скорочтецы - это люди, которые верят, что _прочли_ текст, тогда как они его всего лишь _пробежали_ по диагонали :)....

Ответить на это сообщение
 
 Снобизм
Автор: GraveD 
Дата:   18-09-03 14:42

Ни на одном форуме не видел столько снобов и зануд :)

А: Ехал Грека через реку, видит Грека в реке рак. Забавно, не правда ли?

Б: А что этом забавного? Банальная тривиальщина всем давно известная. Подумаешь, оксюморон!

А: А вы обратите внимание: если сказать быстро, то язык сломаете!

Б: Вы, конечно, молодец. Но я и сам это я сразу заметил. Просто не стал писать. Устал, знаете ли, после работы. Лень было. А вообще говорю я всегда медленно. Поэтому и не понял вашего прикола.

В: А я тоже знаю, что такое оксюморон! Хотел сказать, но не успел :(((

Г: Если уж быть точным, то оксюморон происходит от греч. оксюморон и означает то же, что и оксиморон! А ещё здесь можно применить постоянную Больцмана....

В: А если быть ещё более точным, то постоянная Больцмана == 1,3807*10-23!

Д: Ну это прям как москали любят коверкать язык и говорить "на Украине" против всяких норм...

И так по кругу... :)

Тем не менее этот форум я посещаю гораздо чаще других. И польза его несомненна :)

Всем привет :)

Ответить на это сообщение
 
 Re: Прикладное значение (дались нам перестановки!)
Автор: mathusael 
Дата:   18-09-03 15:12

2Ilyich & Р.Г
Вы, господа хорошие, меня не поняли. Я от рождения такой. Без всякой тренировки. Я себя не случайно "детским" вариантом назвал. А вы слона-то и не заметили, при всем "внимательном" чтении. Скорочтецы обученные читают любой текст практически с одинаковой скоростью. Вопрос о том, хорошо ли это опустим.

И помилуйте, обсуждается же не вопрос о том что информация с помехами принципиально может быть распознана, а то, как и по каким законам это происходит в человечьем мозгу. По крайней мере я вопрос вижу именно так.

2Ilyich
>>> Р.Г.:
>>>>Просто лень обсуждать тривиальщину.
>>>>Обыкновеннейшая передача информации с помехами.

>>> Ну, бальзам на душу ;-) Я тоже не понимаю, почему никого не удивляет то что слегка дефектные архивы всё же раскрываются...

Меня удивляет. (не только архивы, все остальное - тоже). Но все-таки больше всего меня удивляет Ваш техногенный подход. Как работают архиивы, молниеотвод и прочая поганая техника я прекрасно понимаю, если не в технических деталях, то по крайней мере - системно, в терминах - цель, критерий, средства и проч. Причем однотипные системы всегда работают одинаково, пока не сгорели (от стыда за невыполнение приказа). А вот люди - все по разному. Поэтому есть интерес к каким-то закономерностям и особенностям восприятия. Если Вы их знаете и назовете, возможно интерес
пропадет сам собой. Но очень сомневаюсь, что Вы это сделаете.

>>> ...а всё потому, что названия используются не то тривиальные, не то рациональные. Скорее рациональные. Ну да не суть. Суть в том, что не систематические.
-Чооо??? Хоть объясните разницу.

2Р.Г
>>> А вот если опечатки формировать не перестановкой, а заменой - можно получить результат если не более удивительный, то практичный однозначно (проверено на себе).
Ну так поделитесь удивительными результатами!

>>> и сразу непонятные "жека" и "ожел"...
Вот и не читайте каждую букву в отдельности! И не будет никаких проблем со звуками. И не возникнет никаких "ж", там где их и впомине не было. Звук-то ничего особенного не представляет. Обычное "р" только с меньшим вибрированием, близкое к английскому, транскрибируется сочетанием "рж". В чешском аналог - "р с кружочком", "рж", "длинный" вариант - "ржщ".

Кстати, я далеко не согласен с тем что полький такой уж понятный. Из всех славянских, более или менее распространенных, для меня он самый тяжелый. Украинский, белорусский, чешский, словацкий читаются почти без труда. А проще всего почему-то болгарский. Сербохорватский более запутан, но тоже куда ни шло. Со словенским не сталкивался. А вот польский для меня совсем не в кайф, подозреваю что именно из-за особенностей графики. Я с трудом распознаю окончания и смысл фразы ускользает, даже когда слова понятны. О чем я Ильичу и толковал. Люди разные, восприятие разное, интересно было бы иметь статистики... И вопрос-то в уходит в плоскость распознавания образов, а не помехоустойчивости...

Ответить на это сообщение
 
 Офтоп
Автор: Р.Г. 
Дата:   18-09-03 15:26

Ещё одна тривиальщина в том, что 99.9% всех дискуссий в Сети на 2-м собщении переходит с топика на обсуждение себя, любимого, и остальных присутствующих (ещё более любимых, но в несколько извращённой форме:)...).
----------------------------------------
"О присутствующих не говорят."

Ответить на это сообщение
 
 Re: Прикладное значение (дались нам перестановки!)
Автор: Р.Г. 
Дата:   18-09-03 15:46

> И помилуйте, обсуждается же не вопрос о том что информация с
> помехами принципиально может быть распознана, а то, как и по
> каким законам это происходит в человечьем мозгу. По крайней
> мере я вопрос вижу именно так.

Увы (Вам:)...) - по тем же, хорошо известным в теории информации, что и в компе. Информация - она и в мозгу - информация и теореме Котельникова, например, не только поганая (языческая?:)))...) техника, но и Ваш и любой другой мозг, нейронный или электронный, подчиняется столь же однозначно, как законам Ньютона.
Остальное - от лукавого.

>Причем однотипные системы всегда работают
> одинаково, пока не сгорели (от стыда за невыполнение
> приказа).

Вы это серьёзно???? Не работали, видать, с "однотипной" техникой :(((...
Попробуйте, например, с недельку поадминистрировать ма-аленькую сеточку из 10 (десяти всего) однотипных компов с однотипной же программной начинкой - одинаковость их работы Вас "приятно" поразит. :(


>А вот люди - все по разному.
Вы и _это_ серьёзно????
Ау, пиарщики-рекламщики-нейролингвопрограммисты и прочие актёры, жрецы, шаманы, фюреры и прочие манипуляторы массами и толпами, до О. Бендера включительно - налетай!
("Упыри, вурдалаки - ко мне!" (с) Панночка из "Вия")
:))))


> Ну так поделитесь удивительными результатами!

Дык это и делаю: польский текст как русский с заменами.

>И вопрос-то в уходит в плоскость
> распознавания образов, а не помехоустойчивости...

Малость занимался. Помехоустойчивость - как раз одна из основных проблем распознавания образов.
(Как идентифицировать по голосу охрипшую личность, напр.? Или распознать образ(ину) личности с подбитым глазом или просто небритой и опухшей с перепоя?)

Ответить на это сообщение
 
 новое как забытое старое
Автор: Психолингвист 
Дата:   18-09-03 16:34

Цытыта из адной умной книги:

"Любопытно, что даже если слова содержат ошибки, но напоминают слова, знакомые реципиенту, они воспринимаются как знакомые. Особенно ясно это проявилось в экспериментах 50-х годов прошлого века, когда исследователи применяли тахитоскоп — прибор в форме ящика, у которого автоматически отодвигалась крышка на очень короткий промежуток времени, так, чтобы проверить, какое время необходимо испытуемому для опознания слова.

Предъявленное в тахитоскопе Воспринятое испытуемыми
foyever forever
tobxcco tobacco
Shakesbeth Macpeare Shakespeare Macbeth
Только в нескольких случаях испытуемые распознавали искажение".

Канец цытаты.

Ответить на это сообщение
 
 ;-)))
Автор: Ilyich the Toad 
Дата:   18-09-03 16:45

Мафусаилу: что интересно, именно вопрос "по каким законам" здесь (на этом форуме, в этой нити) совершенно не обсуждается. И в "оригинальных" ссылках (чесслово, я таки крепко сомневаюсь, что такое исследование вообще было!) он ни в коей мере не был затронут. Хотя, бесспорно, именно это и есть самое интересно. И потому самое сложное :(

Р.Г. - спасибо большое. Сберегли мне массу времени ;-) Отдельно хочу вякнуть пару слов касательно связи отбраковки помех с распознаванием образов - вот где-где, а тут уж связь налицо, и проявляется в такой степени, что без разработки механизма отбраковки "ненужного" при сохранении (и иногда усилении) "нужного" за проблему распознавания этого самого "нужного" вообще не стоит и браться. Что касается проблемы распознавания личины с подбитым глазом - тут вы переборщили. Есть множество значительно более простых проблем, которые фиг решишь :( Короче, лучше со всем этим вообще не связываться, чесслово...

ЗЫ - что касается снобизма - от всей души спасибо за комплимент; как истинный сноб и зануда, я считаю упрёк в снобизме, и, тем более, в занудстве, комплиментом ;-) И прошу не считать это шуткой ;-)))

Ответить на это сообщение
 
 ...и ещё немного...
Автор: Ilyich the Toad 
Дата:   18-09-03 18:01

mathusael сказал:
>
> 2Ilyich & Р.Г
> Вы, господа хорошие, меня не поняли. Я от рождения такой. Без
> всякой тренировки. Я себя не случайно "детским" вариантом
> назвал. А вы слона-то и не заметили, при всем "внимательном"
> чтении.

Да не в том суть, от рождения вы такой или от людей. Суть в подходе. Я твёрдо уверен в том, что у скорочтецов (что врождённых (если таковые есть), что благоприобретённых) и, скажем, у меня, результаты получились бы сильно разными. Последние отклики вроде как вполне подтверждают.

Ещё могу заметить, что пример-то весьма краток. А вот слабо налабать книгу толстенную с такими ошибками, и выдать народу почитать? И поглядеть, как быстро и как много они поймут?

> >>> Ну, бальзам на душу ;-) Я тоже не понимаю, почему никого
> не удивляет то что слегка дефектные архивы всё же
> раскрываются...
>
> Меня удивляет. (не только архивы, все остальное - тоже).

А что тут удивительного-то? Вот, скажем, берёте файл, делите его на две половины, выполняете любую побитовую логическую операцию по каждой паре байтов (один из первой половины, второй - из второй). В итоге получаете нечто, размером в половину исходного файла, позволяющее полностью восстановить его даже при очень серьёзных повреждениях. Остаётся только проблема обнаружения ошибок - но и тут, опять же, аналогичный подход применим, плюс контроль чётности и всякая фигня.

Пример абсолютно дубовый, я его придумал только что, но, согласитесь, ведь будет работать. Одна проблема - избыточных данных требуется та ещё туча. Но, если немного подумать... да ещё и установить типовые паттерны повреждений для данной среды... Короче, в компьютерной области отнюдь не вчера вся эта защита от сбоев была придумана, и к настоящему времени она весьма неплохо проработана. А уж то, что в языке подобная защита стихийно развилась - вовсе не удивительно, если принять во внимание сроки эволюции и размах тестирования.

> все-таки больше всего меня удивляет Ваш техногенный подход.

А как иначе? Мне ведь за фантазии не плотють :(

> Как работают архиивы, молниеотвод и прочая поганая техника я
> прекрасно понимаю,

Да не в молниеотводе дело. Помехи-то можно и искусственно создавать, да такие, что никакой молнии не приснятся. Вот представьте себе систему передачи команд на подводные лодки, работающую на длинных волнах. Пропускная способность - маленькая, возможностей локализовать источник команд - никаких, так что любой сигнал будет выглядеть, как "свой", плюс "контекста" в нём будет - кот наплакал. Но ведь, блин, работает же!

> >>> ...а всё потому, что названия используются не то
> тривиальные, не то рациональные. Скорее рациональные. Ну да
> не суть. Суть в том, что не систематические.
> -Чооо??? Хоть объясните разницу.

Попытаюсь. Один из примеров имел отношение к химии, так что... Стало быть, есть три основных вида химической номенклатуры: тривиальная, рациональная, систематическая.

Тривиальная возникает, когда человек начинает химичить. Или хотя бы различать разные субстанции. Т.е. ещё до каменного века ;-) Каждой субстанции, полученной каким-либо путём, присваивается индивидуальное название, выдуманное каким-либо путём. Скажем, название вещества, выделенного из растения, может основываться на латинском названии вида растения, или греческом названии цвета вещества, или местном названии вязкой чачи, которую это вещество напоминает, или ещё на чём-нибудь.

Рациональная номенклатура возникает, когда люди овладевают искусством осознанно преобразовывать одно вещество в другое, собирать одно вещество из нескольких фрагментов, или, напротив, разлагать одно вещество на несколько ранее известных. Люди начинают понимать, что одно и то же вещество может быть получено разными путями, и все вещества таки или иначе частично похожи, частично отличаются друг от друга. Появляются названия, сочетающие обозначения нескольких структурных блоков - т.е. вещество описывается не как уникальное, а как несколько похожее на "то" и на "это".

Систематическая номенклатура создаётся, когда люди понимают, что в их силах создать несколько миллионов, а в перспективе и миллиардов веществ. Тогда люди плюют на сходство\отличие\происхождение, и прямолинейно воплощают схему описания графов + стереохимию. Воплощают, понятно, несколько своеобразно (ну, люди, всё-таки), но полно. В результате возникает систематическая номенклатура, с полным описанием связности, да ещё и стереохимии, да ещё и с правилами старшинства для сортировки, и со всякой подобной дребеденью.

Ответить на это сообщение
 
 Re: Прикладное значение (дались нам перестановки!)
Автор: mathusael 
Дата:   18-09-03 19:13

>>> Ещё одна тривиальщина в том, что 99.9% всех дискуссий в Сети на 2-м собщении переходит с топика на обсуждение себя, любимого, и остальных присутствующих (ещё более любимых, но в несколько извращённой форме:)...).

Следующая "тривиальщина", очевидно, заключается в том, чтобы между делом броситься некоей фразой с намеком, и чтобы никто не усомнился, в чей адрес сказано, добавить, что это не о присутсвующих.

Вот видите, какая между нами разница. Я подобные сентенции воспринимаю как желание человека привести в пример хотя бы собственный опыт - на случай если уж других источников нет - и обсудить. Вы сразу на вопрос "о себе любимом" переводите. А информацию вроде бы одну и ту же получили.

Но коль скоро об этом речь уж зашла, то признаюсь, что равнодушен к проблемам перехода на личности вплоть до момента пока от собеседника не перестанет поступать содержательная информация. (Потом - уж как получится). Грешен, частенько забываю, что не все такие.

>>> Увы (Вам:)...) - по тем же, хорошо известным в теории информации, что и в компе. Информация - она и в мозгу - информация и теореме Котельникова, например, не только поганая (языческая?:)))...) техника, но и Ваш и любой другой мозг, нейронный или электронный, подчиняется столь же однозначно, как законам Ньютона. Остальное - от лукавого.

Гы-ы... (Вам) Чтой-то долговато тогда компы в шахматы играть учили. Да и то есть ба-а-альшие сомнения, кто там с Каспаравым на пару с Диип Блю играл. Очень уж он (комп) ПО-ЧЕЛОВЕЧЬИ думал.

Не приведёте ли формулировки упомянутых "законов"? Или ссылки.

>>> Попробуйте, например, с недельку поадминистрировать ма-аленькую сеточку из 10 (десяти всего) однотипных компов с однотипной же программной начинкой - одинаковость их работы Вас "приятно" поразит. :(

Вот уж попали... У меня в прежних реинкарнациях с полсотни бывало, другое дело, что я не один там крутился. Сейчас, правда, уже полтора года всего шестнадцать, не считая соседних подсеток, с которых тоже ко мне с вопросами бегают. Причем компы разные - от первого интелового пентюха на 300 МНz, до амдешек на 2.7 Гиг. Если не подпускать гадких юзверей, которые так и норовят всё по-своему сделать, так компы и работают одинаково ;0))). "Удивлялся" только первую неделю, пока сервак ставил. И не разнобою в работе, а тому, что никто понять не может, что все на разных компах работают.

Короче, Вы опять подменили понятия. Я говорил не про помехоустойчивость а про логику работы. А "помехи" в конце концов каждый раз приходиться людям исправлять.

Ну уж коль скоро Вы даже за компами признаёте право на "самовыражение", то неужто же люди хуже?

>>> Ау, пиарщики-рекламщики-нейролингвопрограммисты и прочие актёры, жрецы, шаманы, фюреры и прочие манипуляторы массами и толпами, до О. Бендера включительно - налетай!

-Пардон? Ваши же примеры против Вас и работают. Если все мы мысли одинаково, то что же до сих пор не попали под воздействие единой идеи, если уж не всемирной, то хотя бы общероссийской? Информацию вроде одинаковую получаем, мозг обрабатывает информацию "одинаково"... Я Вам (по большому секрету) скажу, что именно из-за различий в психологии и не находят откликов во всеобщем сознании упоминаемые Вами разномастные манипуляторы да пиар-технологи. Да, какая-то часть поддается на всю эту белиберду, но заметьте - разные люди на разные трюки. А массовое зомбирование возможно разве что под воздействием галлюциногенов или 25-ого кадра; последнему, впрочем, я не совсем доверяю, экспериментальные результаты уж больно засекречены.

>>> Дык это и делаю: польский текст как русский с заменами.

Простите, но Вы говорили об "удивительных результатах", которые получаются " если опечатки формировать не перестановкой, а заменой".
Я еще могу воспринять оценку приведенных результатов как "удивительных" (хотя решительно с ней не согласен), но причем тут "опечатки, формируемые заменой"? Чего на что? Я не возражаю против того, что все мы в той или иной мере можем читать польский текст, не зная польского языка. Аналогию можно провести с недоброкачественной латинизацией русского алфавита, признать сей факт своеобразной транслитерацией, назвать это тренировкой интуиции, но никак не искажением путем случайной замены букв (а про "неслучайную" замену я и говорить не хочу, сам понимаете почему).

>>> Малость занимался. Помехоустойчивость - как раз одна из основных проблем распознавания образов.
(Как идентифицировать по голосу охрипшую личность, напр.? Или распознать образ(ину) личности с подбитым глазом или просто небритой и опухшей с перепоя?)

"Одна из", но не единственная. К тому же я опять-таки не об этом. Логика работы подобных программ мне относительно понятна, не в пример логике работы пары глаз-мозг.

============================

Я как-то неожиданно для себя оказался чуть ли не самым шумным участником этого обсуждения. Поэтому, исходя из опыта предыдущих ошибок ведения дискуссии, хочу еще раз сформулировать причину возникшего интереса к вопросу.

Сам по себе факт возможности чтения искаженных слов у меня сомнения не вызвает. Котельникова я тоже опровергать не намерен, тем более, что он, насколько помню, говорит о максимуме возможной передачи информации по каналу, а не о способе ее передачи на уровне технического или биологического механизма.

А вот можете ли Вы описать принципы, по котрым мозг или глаз выделяет полезный сигнал? Отбросим даже вопрос о распознавании графемы (сам по себе бесконечно непонятный - недаром человек без подготовки читает текст, и написанный от руки и набранный любой гарнитурой, а файнридер со товарищи каждый раз вынуждены проходить курсы специальной подготовки).
Но как человек "склеивает" из распознанных букв слово?
Каков механизм памяти человека? А без неё - о каком вообще распознавании может идти речь! Почему человек без труда воспринимает объекты на карте, скажем, реки и дороги? А сколько сил и нервов уходит на то, чтобы ввести их в ГИС, даже вспоминать не хочется. И т.д. и т.п.
И в конечном счёте - почему при всей нашей непохожести есть какие-то общие закономерности в восприятии этой самой информации? И какие конкретно?

Узнавание слова с переставленными буквами - не более чем крохотный частный случай всей этой лавины вопросов, но он (случай) имеет прямое к ним (вопросам) отношение.

Извините за многословие. Очень уж не хотелось снова оказаться в роли непонятого изобретателя вечного двигателя. При том, что я на авторство и не претендую.

Ответить на это сообщение
 
 Re: ...и ещё немного...
Автор: mathusael 
Дата:   18-09-03 20:42

2Ilyich
Так, ну позвольте отвечать по порядку
>>>> Мафусаилу: что интересно, именно вопрос "по каким законам" здесь (на этом форуме, в этой нити) совершенно не обсуждается. И в "оригинальных" ссылках (чесслово, я таки крепко сомневаюсь, что такое исследование вообще было!) он ни в коей мере не был затронут. Хотя, бесспорно, именно это и есть самое интересно. И потому самое сложное :(

Жаль, что не обсуждался. Хотя в зачаточном состоянии он был поставлен - верно ли что первая и последняя буквы важнее для восприятия, чем остальные? Я-то думаю, что так оно и есть. Гипотеза такая. Глаз (или мозг) привык выделять пробелы (гениальное изобретение!) и воспринимать слово как бы с двух сторон к центру. В силу особенностей согласования в любом языке направление от начала к центру оказывается более важным, чем от конца.

>>>> Я твёрдо уверен в том, что у скорочтецов (что врождённых (если таковые есть), что благоприобретённых) и, скажем, у меня, результаты получились бы сильно разными.
Полностью разделяю Ваше убеждение. Я об этом и толковал - есть, видимо, два типа чтецов. Первые воспринимают сначала содержание и на основании последующего восприятия формы корректируют смысл. Вторые, наоборот, идут от формы к сути, избегая лишней работы по такой корректировке. Эти вторые действительно наслаждаются правильностью любого текста независимо от содержания. Первые же тусуются на программистских чатах, где соблюдение грамматики считается дурным тоном. Первые схатывают быстрее, вторые - точнее. Опять-таки гипотеза. Разумеется речь не идет о тех, кто читает по складам, для них первый путь невозможен по определению.

>>> Ещё могу заметить, что пример-то весьма краток. А вот слабо налабать книгу толстенную с такими ошибками, и выдать народу почитать? И поглядеть, как быстро и как много они поймут?
Так опять-таки, представители какого из упомянутых типов читать эту продукцию будут? Если быстрочтецы, так я снова вспомню о чатах. Да им же не сутками не надоедает слова уродовать.
>>>(пример с архивом)
Абсолютно не понял. Ни конкретный прием, ни саму идею. Если Вы всерьез полагаете, что длину ЛЮБОГО файла можно сократить вдвое, то почему бы Вам не провести эту операцию над результирующим файлом ещё раз "надцать" и лишить работы всех производителей диcков? Если же речь идет о резервном дублировании информации как способе записи архива, так это вообще отдельная песня.


>>> А уж то, что в языке подобная защита стихийно развилась - вовсе не удивительно, если принять во внимание сроки эволюции и размах тестирования.
Да кто же говорит, что удивительно. Само по себе Ваше наблюдение интересное для меня, я об этом не задумывался. Но не в этом контексте. Я еще раз повторюсь, что в заявленной теме не вижу серьезного предмета для разговора о помехоустойчивости. Не понимаю как, но глаз (или мозг) действительно умеет очень хорошо отфильтровывать огромное число помех. Ответьте хотя бы на вопрос, с какими конкретно он справится, а на каких спасует - и я успокоюсь.

>>>> все-таки больше всего меня удивляет Ваш техногенный подход.

>>> А как иначе? Мне ведь за фантазии не плотють :(
Я имел ввиду, что здесь есть тема для гуманитарного (линвописихологического) и/или физиологического разговора, но никак не технического. Это же относится и к передатчику на подводной лодке. Неужели же вы хотите сказать, что у нас под черепной коробкой реализован тот же принцип фильтрации, что и на ее борту? Невозможно уже потому, что приемник расчитан на информацию от активного передатчика, а мозг при распознавании текста (его еще с натяжкой можно считать активным каналом передачи) пользуется теми же принципами, что и при обработки случайных сигналов распространяемых стихийными природными факторами. По крайней мере я очень сомневаюсь, что хомо сапиенс выработал отдельный самостоятельный механизм для улавливания информации от себе подобных.

>>> (о терминологии в классификации)
Спасибо, я о существовании такой "метаклассификации" (классификации классификаций) даже не догадывался. Но, возвращаясь к исходной позиции - так почему фонетическая и/или визуальная избыточность наименования является следствием несистематического подхода к выбору этого названия? По первому впечатлению скорее должно бы быть наоборот. Не думаю, что "рациональное" название ДНК окажется короче, чем "систематическое" описание ее структурной формулы.;0))))) А коли так то и избыточность наименования имеет место быть во втором случае.

Похоже, мне пора перестать буянить. В ответе Р.Г я уже высказался тезисно по своим исходным убеждениям и причине проявленного интереса к вопросу. Не хочу загромождать форум повторениями, но имею надежду, что и Вы прочитаете. Особо добавить мне нечего, вероятно мое мнение по этой теме мало кому интересно. Я замолкаю, если не будет конкретного развития.

Спасибо.

Ответить на это сообщение
 
 Re: ...и ещё немного...
Автор: Ilyich the Toad 
Дата:   18-09-03 22:40

mathusael сказал:
>
> 2Ilyich
> Так, ну позвольте отвечать по порядку
> >>>> Мафусаилу: что интересно, именно вопрос "по каким
> законам" здесь (на этом форуме, в этой нити) совершенно не
> обсуждается. И в "оригинальных" ссылках (чесслово, я таки
> крепко сомневаюсь, что такое исследование вообще было!) он ни
> в коей мере не был затронут. Хотя, бесспорно, именно это и
> есть самое интересно. И потому самое сложное :(
>
> Жаль, что не обсуждался.

Жаль. Но тут бы надо с конкретными методиками... а не то выйдет сплошное б...дословие. Или словоблудие. Как угодно.

> Хотя в зачаточном состоянии он был
> поставлен - верно ли что первая и последняя буквы важнее для
> восприятия, чем остальные? Я-то думаю, что так оно и есть.

Вопрос спорный. Будучи занудой, я требую экспериментального подкрепления.

> Гипотеза такая. Глаз (или мозг) привык выделять пробелы
> (гениальное изобретение!)

Вот это точно. Всеми конечностЯми "за". Кстати, пресловутая старая традиция типографики целиком и полностью ориентирована на создание графического образа слова, как непрерывного узора, с пробелами по обеим сторонам. И эта самая традиция оченно чётко задаёт длину всех ентих пробелов и всяких прочих шпаций... одно могу повторить - и за двести лет до нас не одни лишь дураки жили. Оченно неглупые правила вся эта публика придумала...

> и воспринимать слово как бы с двух
> сторон к центру. В силу особенностей согласования в любом
> языке направление от начала к центру оказывается более
> важным, чем от конца.

Интересная мысль. Как говорил наш майор: "Я теперь буду думать..." ;-)

> >>>> Я твёрдо уверен в том, что у скорочтецов (что врождённых
> (если таковые есть), что благоприобретённых) и, скажем, у
> меня, результаты получились бы сильно разными.
> Полностью разделяю Ваше убеждение. Я об этом и толковал -
> есть, видимо, два типа чтецов.

Ну вот, как выясняется, после уточнения терминологии количество тем для напрасных споров сокращается (мда, "напрасные споры" - это что-то из жизни грибов в жаркую погоду).

> >>> Ещё могу заметить, что пример-то весьма краток. А вот
> слабо налабать книгу толстенную с такими ошибками, и выдать
> народу почитать? И поглядеть, как быстро и как много они
> поймут?
> Так опять-таки, представители какого из упомянутых типов
> читать эту продукцию будут? Если быстрочтецы, так я снова
> вспомню о чатах. Да им же не сутками не надоедает слова
> уродовать.

Да, но пишут ли они проязведения в пару месяцев длиной? Очень сомневаюсь (основываясь на собственном опыте). Одно дело - тысяча сообщений по одному исковерканному предложению каждое. Другое дело - целостное произведение в тысячу исковерканных предложений.

> >>>(пример с архивом)
> Абсолютно не понял. Ни конкретный прием, ни саму идею. Если
> Вы всерьез полагаете, что длину ЛЮБОГО файла можно сократить
> вдвое, то почему бы Вам не провести эту операцию над
> результирующим файлом ещё раз "надцать" и лишить работы всех
> производителей диcков?

Пардон, вы действительно считаете меня идиотом? Нет, я ничего не имею против, не вы первый, в конце концов... Речь шла о том, что "довесив" к файлу некий кусок размером в 1/2 его размера (простите за "размер его размера"), мы можем поправить ошибки чтения. Ну, естественно, ещё придётся довесить механизм определения ошибок, о чём я тоже писал. Но соль в том, что надёжность записи, сделанной столь примитивным образом, будет выше, чем надёжность двух независимых копий. И притом размер будет меньше ;-) А уж если мы учтём типичные паттерны "порчи"...

> >>> А уж то, что в языке подобная защита стихийно развилась -
> вовсе не удивительно, если принять во внимание сроки эволюции
> и размах тестирования.
> Да кто же говорит, что удивительно. Само по себе Ваше
> наблюдение интересное для меня, я об этом не задумывался. Но
> не в этом контексте. Я еще раз повторюсь, что в заявленной
> теме не вижу серьезного предмета для разговора о
> помехоустойчивости. Не понимаю как, но глаз (или мозг)
> действительно умеет очень хорошо отфильтровывать огромное
> число помех. Ответьте хотя бы на вопрос, с какими конкретно
> он справится, а на каких спасует - и я успокоюсь.

Одно могу сказать и Вам, и Мафусаилу: тут мы наступаем на Великие Вилы Нейронных Систем. Коротко говоря, Вилы состоят в том, что нейронные системы всё понимают, но сказать ничего не могут ;-) И человек тут - не исключение. Т.е. эти, блин, люди, тудыть их растудыть, решают довольно сложные вопросы - но вот КАК - и сами объяснить не могут. Лично мне несколько иными вопросами приходится заниматься (хотя параллелей - та ещё туча), но проблемы с распознаванием - абсолютно те же самые. Что же касается распознавания конкретных конструкций - во-первых, вы всерьёз ожидаете адекватных алгоритмов "за бесплатно"? А во-вторых, если такие найдёте (и без патентов пжалст) - сразу шлите мне, буду вам очень благодарен ;-)))

> >>>> все-таки больше всего меня удивляет Ваш техногенный
> подход.
>
> >>> А как иначе? Мне ведь за фантазии не плотють :(
> Я имел ввиду, что здесь есть тема для гуманитарного
> (линвописихологического) и/или физиологического разговора, но
> никак не технического.

Да есть, конечно. Но всё-таки хотелось бы воплотить продукт разговора в некую технологию. Кстати, вот именно физиология в неё вполне хорошо воплощается ;-)

> Это же относится и к передатчику на
> подводной лодке.

Пардон, но в описанном мною примере никакого передатчика на борту подводной лодки и быть не может. Её потенций еле-еле на приёмник хватает.

> Неужели же вы хотите сказать, что у нас под
> черепной коробкой реализован тот же принцип фильтрации, что и
> на ее борту?

Ничуть. У нас под черепной коробкой явно реализован иной алгоритм - мы ведь не очень хорошо воспринимаем точные координаты цели, но зато образы всякие...

Когда наконец просплюсь, припомню вам пример из своей жизни, ok? ;-)))

> Невозможно уже потому, что приемник расчитан на
> информацию от активного передатчика, а мозг при распознавании
> текста (его еще с натяжкой можно считать активным каналом
> передачи) пользуется теми же принципами, что и при обработки
> случайных сигналов распространяемых стихийными природными
> факторами. По крайней мере я очень сомневаюсь, что хомо
> сапиенс выработал отдельный самостоятельный механизм для
> улавливания информации от себе подобных.

Чегой-то я ничего не понял. Точно спать пора ;-) Может, завтра соображу... Вроде остаток вашего сообщения содержит вполне разумные вопросы\ответы, так что я непременно уделю им внимание, но не сейчас.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: NN 
Дата:   19-09-03 01:03

Добавлю наблюдение (уж больно мне подписаться на эту ветку хоцца): в русском тексте сохранены преимущественно не первая и последняя, а первая и ДВЕ последних буквы...

Ответить на это сообщение
 
 ... а потом ещё немного...
Автор: Ilyich the Toad 
Дата:   19-09-03 23:27

Так, ладно, я почти уже проспался. Правда, всё ещё чихаю, кашляю, и дико хриплю. Но соображаю уже несколько лучше. Я уже даже заметил, что фразу "Одно могу сказать и Вам, и Мафусаилу" я адресовал именно Мафусаилу ;-)

> Невозможно уже потому, что приемник расчитан на
> информацию от активного передатчика,

А какая разница-то? Ну, в электронной почте передатчик - "активный", а в наскальных надписях - "пассивный". А разницы-то никакой. Что там видим частично порушенный текст, что сям.

> а мозг при распознавании
> текста (его еще с натяжкой можно считать активным каналом
> передачи) пользуется теми же принципами, что и при обработки
> случайных сигналов распространяемых стихийными природными
> факторами. По крайней мере я очень сомневаюсь, что хомо
> сапиенс выработал отдельный самостоятельный механизм для
> улавливания информации от себе подобных.

Вот это оченно интересный вопрос. Дело в том, что вообще обработка зрительного сигнала осуществляется человеком на многих совершенно различных уровнях. Зачастую, похоже, ещё и до головного мозга. Да и в головном мозге - в нескольких разных отделах. Область моих интересов лежит, в основном, в сфере этого "препроцессинга", и лишь одно могу сказать - теорий там сильно более одной, а вот что касается результатов... короче, тут чёрт ногу сломит. Жуткий гимор именно в том и состоит, что эти люди, мать их так и эдак, ловко анализируют контекст изображения. А как они это делают - не сознаются. Мне и самому было бы жутко интересно знать, как люди глаза от губ отличают. В принципе, тут можно схитрить с анализом цветности, но, блин, эти самые люди ещё и "серые" фотографии неплохо распознают... А уж как они отличают щёку ото лба - для меня вообще загадка.

А уж если за текст браться... Очевидно, что сапиенс сапиенс выработал отдельный механизм для улавливания информации от себе подобных. Для чтения текстов, например. А вот в какой мере тут работают "старые" механизмы распознавания, существовавшие ещё у рептилий, а в какой - новые, с анализом содержания текста - это уж не ко мне вопрос. Помнится, на старых китайских инсектицидах было написано: "при пересечении черты тараканами, клопами и муравьями они моментально пасют". Не знаю, что это слово значит - но вот я при пересечении черты таких тонкостей моментально "пасю" ;-)))

Что касается эксперимента, описанного Психолингвистом - увы, и тут никто не измерял затрат времени на интерпретацию неправильно написанного слова. Надеюсь, никто не станет спорить с тем, что эти затраты могут отличаться от затрат на краткосрочное запоминание визуального образа этого самого слова. По последней части, люди иногда демонстрируют феноменальные результаты.

Пример из моей собственной жизни: некоторое время тому, пользуясь услугами метрополитена им. Кагановича, я, поглядев на какого-то мужика с газетой в руках, отчётливо почуял слово "задница". Причём осознал я это обстоятельство в тот момент, когда мужик в дверь выходил. Будучи человеком не столько любопытным, сколько занудным, я, выйдя из метро, купил ту же самую газету и открыл её на той же странице (у меня хорошая зрительная память. Собственно, это единственная разновидность памяти, на которую я не могу пожаловаться) - и, представьте себе, обнаружил там речь не то Немцова, не то Явлинского (никак не могу запомнить разницу. Вот тут зрительная память не помогает совершенно), содержавшую предложение молодёжи на грядущих выборах "оторвать задницу и явиться на избирательный участок" (это вообще отдельная песня. Я лично так и не понял, кому именно молодёжь должна оторвать означенную часть тела. То ли молодые люди должны подвигнуться на коллективное жертвоприношение, то ли должны заняться охотой за скальпами в извращённой манере. В общем, я понял только одно - людям с расшатанными нервами, вроде меня, на избирательный участок являться не стоит). Я и сам был крайне удивлён, увидев эту фразу - оказывается, я с расстояния двух метров за доли секунды выделил именно ТО САМОЕ слово, которому, на мой взгляд, в газете не место. Круто, блин ;-) А вы говорите - ящик, и всё такое...

Ответить на это сообщение
 
 Re: Тут оригинал на буржуйском
Автор: Александр Ш. 
Дата:   20-09-03 01:01

К сожалению, англоязычной лингвистике не чужд грех никчёмной универсализации всему человечеству утверждений о своём языке. Пока аналогичные опыты не проведены у нас с русской лексикой, такое явление в восприятии русского языка мне кажется неправдоподобным, так как наша речь всё-таки сохраняет принципиально синтетическое строение, а письменность, ввиду этого, — слоговое. Кстати, тут важно ещё то, что русские слоги почти всегда открытые, а английские — закрытые.

Кстати, о модной теории "иероглифности" написанного слова. Я где-то прочёл об опыте преподавания "whole language" в Канаде: лет десять-двадцать грамоте учили, как по-китайски, "целыми" словами, а не на основе звуков и корней. Казалось бы, английский язык почти без флексий, а орфография у него прямо кошмармая: ожидались успехи... А оказалось, что количество элементарных, беспардонных ошибок в письменном языке детей скакнуло, и страшно. Кончилось, или точнее кончается, всё это тем, что в канадских школах, по требованию многих родителей, возвращаются к традиционной учёбе фонетических принципов "phonics".

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Vlad 
Дата:   21-09-03 10:17

Наверное, всерьёз - и эта тема весьма интересна! Но дисукссию зедсь пчуемо-то не сомг доичттаь до кцона - уастл.

Vlad

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Vlad 
Дата:   21-09-03 11:50

См. http://forum.oszone.net/topic.cgi?forum=13&topic=1067&start=0

Vlad

Ответить на это сообщение
 
 Re: ... а потом ещё немного...
Автор: mathusael 
Дата:   24-09-03 11:15

2Iltich
Ну во-первых - спасибо за подробный ответ. Физически не мог сразу на всё это ответить, так что - изиняйте.

Собственно, продолжить-то тему по сути не вижу "материала". Так что пока пару мелочей:

>>> "довесив" к файлу некий кусок размером в 1/2 его размера (простите за "размер его размера"), мы можем поправить ошибки чтения. Ну, естественно, ещё придётся довесить механизм определения ошибок, о чём я тоже писал. Но соль в том, что надёжность записи, сделанной столь примитивным образом, будет выше, чем надёжность двух независимых копий. И притом размер будет меньше ;-)

Сиё правда святая есть. Вот только работать это будет лишь на "осмысленных" файлах, которые всегда содержат огромный элемент избыточности. А попробуйте-ка таким образом кодировать, к примеру, белый шум или уже хорошо запакованный архив (если не знать его содержания и алгоритма паковки) - я сомневаюсь что надежность описываемой Вами схемы будет выше отвергаемого Вами дублирования. Я, кстати, всегда сомневался в концепции понятия "надежность" в этом контексте. Надо бы, видимо, различать надежность распознования и надежность оценки достоверности распознования. Архиваторы работают по принципу - "не сошлась CRC - пиши пропало". Наши потуги блобом вытащить небитые куски и прочее шаманство - это уже не их (архиваторов) проблема; Rar вроде бы позволяет вытащить небитые блоки, потому как в начале кахдого куска текущие значения Хоффмановского состояния, но это частности. Любой битый байт приводит к порче всего остатка сообщения. Архиватор "видит", что архив битый, но возможности "переспросить" в отличие от модема, у архиватора нет. Максимум, на что может рассчитывать обладатель битого архива - честное сообщение о невозможности распознать "сообщение". Итак, НАДЁЖНОСТЬ "передачи" архивированного сообщения - МНОГО НИЖЕ, чем у неархивированного, правда за счет CRC практически исключена возможность ложного распознавания, но это другая песня. Поэтому-то я и не согласен с Вашей идеей о довеске куска половинной длины в именно в архив. Максимум, чего вы добьётесь - увеличите длину CRC до астрономических значений. Но надежности именно передачи сообщения это не добавит.

>>> А уж если мы учтём типичные паттерны "порчи"...
Во! Тут то я и вставлю своё веское... Речь же в конце концов и шла о том, какие "паттерны порчи" глаз считает за типичные и поэтому справляется с ними без особых проблем, а какие заставляют его призадуматься.

>>> Очевидно, что сапиенс сапиенс выработал отдельный механизм для улавливания информации от себе подобных. Для чтения текстов, например.

Я не о том. Это канал передачи. Но вот пара глаз-мозг (рецептор-анализатор, чтобы избежать разговора о препроцессоре и проч). работает совершенно так же как и при разглядывании звездного неба. Опять-таки, если убедите меня, что механизмы фильтрации помех (а именно всвязи с ними - с Вашей же подачи - я и завел тот разговор) принципиально новый - будет другой разговор. Сапиенс склонен во всем незнакомом видеть следы рук человеческих, по крайней мере - разумных существ. От марсианских каналов до насылания порчи на корову, не говоря уж о религии как таковой. Это свидетельствует о том, что упомянутого отдельного механизма для улавливания информации (т.е. приема оной, не передачи!) у сапиенса все-таки нету.

>>> Одно могу сказать и Вам, и Мафусаилу: тут мы наступаем на Великие Вилы Нейронных Систем. Коротко говоря, Вилы состоят в том, что нейронные системы всё понимают, но сказать ничего не могут ;-) И человек тут - не исключение. Т.е. эти, блин, люди, тудыть их растудыть, решают довольно сложные вопросы - но вот КАК - и сами объяснить не могут. Лично мне несколько иными вопросами приходится заниматься (хотя параллелей - та ещё туча), но проблемы с распознаванием - абсолютно те же самые. Что же касается распознавания конкретных конструкций - во-первых, вы всерьёз ожидаете адекватных алгоритмов "за бесплатно"? А во-вторых, если такие найдёте (и без патентов пжалст) - сразу шлите мне, буду вам очень благодарен ;-)))

Да мне не алгоритмы - хотя бы область их применения... А на это патентов не заводят. Наоборот, информация на которую потребитель имеет право по закону ;0))))

На остальное сейчас просто нет времени... До следующего раза. Хотя когда он будет - не знаю... Заморочки начались у меня надолго.. :((((

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   24-09-03 22:16

2Mathusael: Я не молчу, я думаю... ;:)... Над расшифровкой собственного поста, написанного в порыве вдохновения.
2GraveD: Многоточие в конце там точно есть...
ЧИТД :)

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   24-09-03 22:32

И ещё интересный вопрос:
Почему, когда в беседе с химиком возникает "сульфит калия", у меня вопросов не возникает, а в беседе с "любителем похимичить" я всегда переспрашиваю, идёт ли речь о K2SO3 (сульфит), K2S (сульфид) или K2SO4 (сульфат)?

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   24-09-03 22:36

2GraveD:
Кстати, а Вы не SergeyN c kkm.info?

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   25-09-03 11:08

+++ в компьютерной области отнюдь не вчера вся эта защита от сбоев была придумана +++
Смутно помню какую-то теорему о том, что любую двоичную схему можно построить для любой наперед заданной надёжности (при достаточном количестве вентилей).

-----------
Кстати говоря, я придумал применение для таких "битых" текстов.
Стеганография!
То есть в открытой системе (Сеть) нужно передать от одного человека другому информацию так, чтобы ее можно было прочитать совершенно свободно, но поисковые механизмы при этом её не обнаружили.
Это один из способов.

Коялн есть заакз ндоа пршиить тут одоного клеинта дают трицдать тонн бкасов.

Ответить на это сообщение
 
 Папа, а ты с кем сейчас разговариваешь? ;-)
Автор: Ilyich the Toad 
Дата:   25-09-03 15:45

Арнольд сказал:
>
> -----------
> Кстати говоря, я придумал применение для таких "битых"
> текстов.
> Стеганография!
> То есть в открытой системе (Сеть) нужно передать от одного
> человека другому информацию так, чтобы ее можно было
> прочитать совершенно свободно, но поисковые механизмы при
> этом её не обнаружили.
> Это один из способов.
>
> Коялн есть заакз ндоа пршиить тут одоного клеинта дают
> трицдать тонн бкасов.

Э, пардон, а я кому байку про партизан рассказывал? Пушкину? ;-)))

Вот вспомните известный рассказец товарища По. А теперь представьте, что пирата выгнали из первого класса за вопиющую безграмотность (так что частотность букв в записке слетает на фиг), и пробелов он принципиально сторонился (так что артикли "the" и "a") не распознаются. Чёрта лысого герой бы нашёл, а не пиастры.

Ну что, наколем подслушку КГБ, замутим что-нибудь антиконституционное? ;-)))

Ответить на это сообщение
 
 ...пока совсем ничего не осталось...
Автор: Ilyich the Toad 
Дата:   25-09-03 15:59

mathusael сказал:
>
> 2Iltich

Это - тест по теме публикации? ;-)))

> >>> "довесив" к файлу некий кусок размером в 1/2 его размера
> (простите за "размер его размера"), мы можем поправить ошибки
> чтения. Ну, естественно, ещё придётся довесить механизм
>
> Сиё правда святая есть. Вот только работать это будет лишь на
> "осмысленных" файлах, которые всегда содержат огромный
> элемент избыточности.

Не-а, моя идея будет работать всегда. Зуб даю ;-) Неприятность в том, что объём избыточой информации будет чудовищен, а надёжность не слишком велика. Но это детали. Это просто означает, что действовать надо умней ;-) Но уж от природы защищаемого файла тут ничего не зависит, ещё один зуб даю ;-)))

> >>> А уж если мы учтём типичные паттерны "порчи"...
> Во! Тут то я и вставлю своё веское... Речь же в конце концов
> и шла о том, какие "паттерны порчи" глаз считает за типичные
> и поэтому справляется с ними без особых проблем, а какие
> заставляют его призадуматься.

И, как я уже говорил, вопрос, конечно, интересный, но вот именно этого в заявленных результатах я не наблюдаю. Наблюдаю лишь ни на чём не основанные рассказы про "почти полный беспорядок", за который пытаются выдать беспорядок очень даже незначительный. Мухлёж! ;-)

> >>> Очевидно, что сапиенс сапиенс выработал отдельный
> механизм для улавливания информации от себе подобных. Для
> чтения текстов, например.
>
> Я не о том. Это канал передачи.

Вопрос в том, не висит ли на этом отдельном канале совершенно отдельный анализатор. Лично я не могу ответить ни "да", ни "нет". Рылом не вышел ;-) Не моя область. Вопрос я вижу, а вот ответ...

> Но вот пара глаз-мозг
> (рецептор-анализатор, чтобы избежать разговора о
> препроцессоре и проч). работает совершенно так же как и при
> разглядывании звездного неба. Опять-таки, если убедите меня,
> что механизмы фильтрации помех (а именно всвязи с ними - с
> Вашей же подачи - я и завел тот разговор) принципиально новый
> - будет другой разговор.

А я не могу вас убедить по той простой причине, что не уверен в самой возможности получить убедительный ответ. В самом деле, как выяснить, не работает ли мозг при распознавании текста несколько иначе? Особливо если учесть, что большинство стадий будут заведомо теми же? Но вот большинство, или все - как узнать?

Ответить на это сообщение
 
 О чём я и говорил
Автор: Ilyich the Toad 
Дата:   25-09-03 16:12

Dend сказал:
>
> И ещё интересный вопрос:
> Почему, когда в беседе с химиком возникает "сульфит калия", у
> меня вопросов не возникает, а в беседе с "любителем
> похимичить" я всегда переспрашиваю, идёт ли речь о K2SO3
> (сульфит), K2S (сульфид) или K2SO4 (сульфат)?

Да именно потому, что названия-то систематические! Корень сообщает вам, что вы имеете дело с серой, а "ат", "ит" или "ид" задаёт степень окисления оной. Химик сразу поймёт, что в "иде" она наименьшая, а в "ате" - наибольшая, и это принципиально важно. А нормальный человек с лёгкостью может перепутать буковку, поскольку для него это - "просто слова", он смысла-то не видит.

Вот поэтому-то я и заявил, что помехоустойчивость систематической номенклатуры принципиально ниже - она не создавалась естественным путём в течение миллионов лет, а была изначально создана "под химию", чтоб адекватно суть дела описывать и при этом не нуждаться в дальнейших изменениях. И уровень помех в её передаче всегда был крайне низок - грубо говоря, статьи-то проверяются и рецензируются ;-)

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   25-09-03 17:23

+++ Э, пардон, а я кому байку про партизан рассказывал? Пушкину? ;-))) +++
Миль пардон! Пропустил читаючи. Тоже уастл, навенрое. :))

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   26-09-03 21:44

>Да именно потому, что названия-то систематические! Корень сообщает вам, что вы имеете дело с серой, а "ат", "ит" или "ид" задаёт степень окисления оной. Химик сразу поймёт, что в "иде" она наименьшая, а в "ате" - наибольшая, и это принципиально важно. А нормальный человек с лёгкостью может перепутать буковку, поскольку для него это - "просто слова", он смысла-то не видит.

Ильич, Вы меня, наверное, не поняли... Разъяснять, почему химик поймёт отличие, а "любитель" -- нет, -- не нужно, это и так понятно, а вот как профессионал безошибочно отличает любителя, даже если тот "словей нахватался" -- вот в чём вопрос...

Ответить на это сообщение
 
 Kembridzh
Автор: MartMar 
Дата:   26-09-03 22:35

Eto byl Cambridge University.

Cheshskaya versiya zdes:
http://ftipky.cz/tex.php?id=509&ko=999&radit=dat

Ответить на это сообщение
 
 Рыбак рыбаку глаз не выклюет...
Автор: Ilyich the Toad 
Дата:   27-09-03 07:44

Dend сказал:
>
> Ильич, Вы меня, наверное, не поняли...

Ну, мне оно не впервой ;-)

> Разъяснять, почему
> химик поймёт отличие, а "любитель" -- нет, -- не нужно, это и
> так понятно, а вот как профессионал безошибочно отличает
> любителя, даже если тот "словей нахватался" -- вот в чём
> вопрос...

Не знаю, по пропуску, наверное ;-) Если серьёзно - мне как-то профессионала на улице отличать не приходилось. Они мне обычно попадаются в сконденсированном состоянии, компактными конгломератами, и предъявите пропуск в развёрнутом виде ;-)

Ответить на это сообщение
 
 ностальгия по настоящему
Автор: adada 
Дата:   27-09-03 13:11

Систематически -- и опять -- появляются сообщения о будто бы особой, извечной "помехозащищенности", "помехоустойчивости" народного языка.
Русского? Всякого?
Но из дискуссий языковых гурманов всякий раз вытекает обратное! Помехи источника, и/или транслятора, и/или приемника преодолеваются не благодаря их речи, а вопреки.
Не от этого ли такая тоска по тотальной норме?

Ответить на это сообщение
 
 А что вас удивляет-то?
Автор: Ilyich the Toad 
Дата:   27-09-03 20:59

adada сказал:
>
> Систематически -- и опять -- появляются сообщения о будто бы
> особой, извечной "помехозащищенности", "помехоустойчивости"
> народного языка.
> Русского? Всякого?

Всякого. Развитого.

> Но из дискуссий языковых гурманов всякий раз вытекает
> обратное!

Ничего обратного не вытекает. Только прямое. Это я вам как химик говорю ;-)

> Помехи источника, и/или транслятора, и/или
> приемника преодолеваются не благодаря их речи, а вопреки.

А кого "их"? Я что-то с вашими помехами разобраться не могу. Их - это гурманов, источников, трансляторов и приёмников?

А вообще, что вас удивляет-то? Ну да, язык обладает защитой от помех. Но какой же психически нормальный деятель станет нарочно вносить помехи? Увеличивать время на обработку сообщения реципиентом, вызывать у него неприятные эмоции ("это что за бездарь неотёсанный какую-то дребедень безграмотную пишет!"), создавать угрозу неправильного прочтения сообщения? Вот, скажем, мне это надо? Я и без того изъясняюсь довольно бестолково, если я начну делать это ещё и безграмотно... меня мокрыми тряпками побьют. И поделом. С чего бы люди должны разбирать мою галиматью? Это я обязан позаботится о читаемости сообщения.

Так что не вижу предмета удивления. Да, помехозащищённость есть. Да, определённые отклонения от нормы могут компенсироваться на стороне реципиента. Но всё-таки лучше придерживаться нормы и не заставлять последнего расходовать свои усилия на компенсацию безграмотности отправителя.

Ответить на это сообщение
 
 ОТ Во, вспомнил!!!
Автор: Ilyich the Toad 
Дата:   27-09-03 21:02

Во, я таки вспомнил, как отличить химика от нормального человека! Это ж старинная народная примета: только настоящий практикующий химик неизменно моет руки ПЕРЕД тем, как пойти в туалет!

ЗЫ - по утверждению супруги, правило распостраняется и на женщин. Не спрашивайте меня, почему...

Ответить на это сообщение
 
 Про помехи
Автор: adada 
Дата:   28-09-03 11:14

%Ilyich the Toad%
А Вы меня рассердили. :)
Тем, что рассердились на меня, точнее, тем, что я дал повод для такой незапланированной вечерней физиологической реакции своим неуклюжим письменным языком. Справедливости ради, разрешаю написать мне эпитафию с ошибками...

Смысл моего незамысловатого замечания о презумпции свойства развитого языка быть помехоустойчивым вот в чем (если и перегну для ясности палку, то малость).
Ни черта язык не помехозащищен! Смешно считать защитой его избыточность. Многочисленные семантические кружева (еще неизвестно, преобладают ли они в развитом языке) не защищают от помех при передаче информации, хотя бы потому, что они не дублируют друг друга (как системы в технике).
Для того, чтобы устранить фон, людям каждый раз приходится многократно прогонять одну и ту же информацию через речевой канал, подбирая слова и выражения не по их смыслу, а -- к собеседнику, к его личности. (Хороший правильный язык -- тот, который Вы избираете, чтобы быть понятым Мной.)

Позвольте выразиться афористично: не язык избыточен, а человек недостаточен.
Но такое "слишком человеческое" нельзя исправить инструментально, особенно, тщаниями фразеологов, особенно, заквашенных в эпоху безвременья. Упование на инструмент -- характерная особенность технаря...

+Не зря Бабель написал как минимум 22 варианта "Любки".

Ответить на это сообщение
 
 Куда удивительнее, хоть и не ново...
Автор: UPS 
Дата:   03-10-03 03:44

Древние аккадцы заимствовали клинопись у еще более древних шумеров. В шумерской клинописи было три типа знаков: идеографические, или словесные знаки (например, условное изображение руки читается "рука" - по-шумерски, естественно), слоговые знаки (например, то же изображение читается "ру" или "рук" - т.е., опять же, по-шумерски - и может входить в обозначение других слов, например "ру-банок" или даже "вд-рук" - такое у них сплошь и рядом бывало) и детерминативы (то же изображение ставится перед словом, чтобы читатель понял, что дальше речь пойдет о чем-то имеющим отношение к руке. Тогда изображение руки никак не читается). Кроме того, слоги "Согл. + Гл. + Согл." они иногда писали как "Согл. + Гл." + "Гл. + Согл.". Т.е. могли нарисовать один знак "рук", а могли два "ру" + "ук".
Древние аккадцы, заимствовав клинопись у еще более древних шумеров, стали, естественно, читать идеографические знаки по-аккадски. Т.е. знак "рука" озвучивался уже иначе. И соответственно мог обозначать другие слоги. Но почему-то последовательно придерживаться этой стратегии они не пожелали и иногда сохраняли за знаком шумерское звучание.
Результат (я цитирую): "Так, знак (***) может быть словесным знаком для аккадских слов s*ad^u "гора" и ma-tu "страна" (потому что по-шумерски они были омонимами), детерминативом перед наименованиями гор и стран и, наконец, слоговым знаком с чтениями kur, mat, s*at, nat, gin и т.п.(!) Знак (***) может быть словесным знаком для аккадского s*ammu "трава", детерминативом перед наименованиями растений и слоговым знаком с чтениями u' ("трава" по-шумерски) и s*am. Множественность чтений слоговых знаков, так называемая полифония, представляет собой одну из основных трудностей, препятствующих гладкому чтению аккадской клинописи, в особенности новоассирийской" (И.Фридрих, История письма, пер. Дьяконова, 2001, стр 69-70).
Ну, и как вам это нравится? Не кажется ли вам, что чтение с перестановленными буквами - детская забава по сравнению с этими ребусами, которыми аккадцы отнюдь не развлекались, а пользовались в самых что ни на есть прагматических целях и считали удобными (использовали почти 2 000 лет)!
Можно, конечно, называть это полифонией или другим красивым словом. Но я не верю, что эти шумерологи или как их там ничего не напутали при дешифровке!!! Гладкому, понимаете ли, чтению препятствует! Да как вообще возможно какое бы то ни было чтение при такой системе? И не надо ссылаться на совр. иероглифические системы - там все же ситуация проще. А если они не напутали - поистине, языковая избыточность не знает границ! Любой компьютер давно бы спятил.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   03-10-03 15:36

+++ И.Фридрих, История письма +++
Книга совершенно фантастическая. Там такое ужасное предостережение стоит от копирования в любом виде... а то бы давно отсканировал оттуда что-нибудь да выставил.

Кстати говоря, чтение перетасованных слов мне встречалось в каком-то тесте (едва ли не IQ).

Ответить на это сообщение
 
 Re: Куда удивительнее, хоть и не ново...
Автор: mathusael 
Дата:   03-10-03 16:49

>>> И не надо ссылаться на совр. иероглифические системы - там все же ситуация проще.
Либо Вы про аккадское знаете больше чем написали, либо про японское меньше чем надо, что бы делать такие заявления. Сочетание китайской иероглифики и двух слоговых азбук ("кан") даёт широкий простор для "творчества". Ну скажем, заимствонанные способы для передачи китайских омонимов, которые в японском совсем даже и не омонимы. Смешанное написание "иероглиф+кана" - вполне обычное дело. Ну и прочее и прочее и прочее. Чего, простите, в японском нет такого, что есть в аккадском? Ну по-крайней мере - из того, о чем шла речь в цитате из Фридриха? Может пять "чтений" и не частый случай, но два-три - обычное дело. Самое смешное, когда в одном слове (!) встречается два чтения одного иероглифа. Или вот знак, который означает "повторить предыдущий", при этом совершенно не обязательно, что повторение будет иметь то же чтение, что и первый знак. А Вы говорите - "компьютеры"...

ЗЫ Я не японист. Дилетантствую и в чем-то могу ошибаться. Сведения - из "Учебного словаря иероглифов". Там на эту тему еще много всякого было понаписано, моему серому уму неподвластное...

Ответить на это сообщение
 
 Тьфу, опять слово выпало
Автор: mathusael 
Дата:   03-10-03 16:51

subj.

читать -

Либо Вы про аккадское ПИСЬМО знаете больше...

Ответить на это сообщение
 
 Re: Куда удивительнее, хоть и не ново...
Автор: UPS 
Дата:   04-10-03 21:01

Я про японское небогато знаю, конечно. По-моему, в одном тексте используется либо одна азбука "кана", либо другая. Т.е. две системы - иероглифы и кана, но не все три. Правильно? И потом, ведь кана по внешнему виду отличаются от иероглифов. Сразу можно понять, фонетически этот знак нужно читать или это идеограмма. На вопрос "чего нет такого, что есть в аккадском" отвечаю: нет по крайней мере знаков, которые читаются то на одном языке, то на другом. Если я ошиблась, поправьте. В том виде, в каком я себе это представляю, японская письменность проще. Хотя у людей, привыкших к алфавитному письму, тоже волосы дыбом легко встают.
В главных IQ-тестах (Векслер, Айзенк, Амтхауэр) перетасованные слова точно есть, проверяют комбинаторные способности. Анаграммы называются, все с ними сталкивались, наверно. Решать анаграммы гораздо сложнее, чем читать тексты с переставленными буквами, вроде первого в этой теме. Тут два фактора работают: во-первых, начала слов - это действительно самое важное, а во-вторых, при восприятии связного текста контекст играет гораздо бОльшую роль, чем отдельная буква или отдельное слово. Mathusael в своем посте целое слово пропустил - без всякого ущерба для читателя (меня). Если бы не subj, я бы и не заметила :).

Ответить на это сообщение
 
 Re: Перестановки букв в словах
Автор: IF 
Дата:   04-10-03 21:05

Пишите: inpas28@yandex.ru

Ответить на это сообщение
 
 Re: Куда удивительнее, хоть и не ново...
Автор: mathusael 
Дата:   05-10-03 11:59

>>> Т.е. две системы - иероглифы и кана, но не все три. Правильно?
Нет. Иероглифика используется для передачи смысловой части текста (корней). Хирогана ("круглая" азбука) используется для написания суффиксов и других несмысловых частей слова (понятие "приставка", "окончание" и проч. не совсем применимы к японскому). Катакана ("квадратная") главным образом для передачи основ в тех случаях, когда иероглифов "не хватает" - иноязычных имён собственных и проч.. Т.е. разные _слова_ пишутся _разными_ азбуками. Но правило это не жесткое (в японском письме вообще нет жёстких правил), соблюдаемое, в лучшем случае, только в официальных документах. В газете, напремер, каждый автор волен придумать свой способ обозначения того или иного слова. Поскольку в японском масса двухосновных слов (бОльшая часть словарного запасса), соединяемых с тому же с помощью специальных суффиксов, можно представить себе сколько способов написания может быть у самых простых слов. Кто-то подсчитывал, что в средней японец, читая газету встречает один незнакомый способ написания в каждом тираже... Я уж не говорю о случаях, когда махонькая черточка меняет смысл слова до неузнаваемости.
Я, наверно, должен остановиться, ибо здесь есть настоящие японисты. Еще ляпнешь чего - засмеют. ;0))))))

>>> И потом, ведь кана по внешнему виду отличаются от иероглифов.
Да, но непосвященному это не всегда видно. Всё-таки в каждой кане - за семь десятков знаков, не считая "диакритики".

>>> по крайней мере знаков, которые читаются то на одном языке
В каком смысле? Насколько понимаю, все знаки в аккадском письме, читаются именно на аккадском (;0))). А то, что прочтения одного знака могут быть совершенно разными, часть из которых восходит к китайсому звучанию слова, часть к японскому, часть базируется на пиктографическом принципе, а часть вообще следствие смешения двух разных знаков, не имеющих общего смыслового значения - так это в японском сплошь и рядом. (Это еще не всё, есть иероглифы, которые вообще ничего конкретного не значат, я приводил пример знака для повторения, их правда очень мало). Ну и самое интересное - китайские и корейские фамилии в текстах обычно набирают японскими иероглифами. Разумеется ничего общего в произношении у трёх языков нет. Китайские звучания еще сохранили какую-то далёкую связь с японскими кунами ("названиями" знаков), но корейские нигогда её и не имели. Так что аккадцы - первые, но не последние в этом сумасшедшем доме.

То о чем Вы говорили, в бОльшей степени применимо к китайскому. Так принципы "один знак - одно прочтение" и "одно слово - одно написание") соблюдаются более последовательно, к тому же практически отсутствуют не только флексии, но и аффиксы.

Ответить на это сообщение
 
 Re: Куда удивительнее, хоть и не ново...
Автор: UPS 
Дата:   05-10-03 21:52

2 mathusael
Даа... просветили, спасибо, и убедили. Японцы с аккадцами и впрямь друг друга стоят, значит, шумерологи не напутали. Кошмар какой-то. Из этого, между прочим, вывод: нам просто смешно говорить о каких-то реформах орфографии. Если homo sapiens способен читать-писать в таких системах, значит ни для обучения, ни для простоты восприятия совершенно неважно, логичная у нас орфография или нет. Ко всему привыкнем, все проглотим.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Арнольд 
Дата:   06-10-03 10:38

Кстати говоря, вот как выглядят слова некогда известной песни, будучи переложены на катакану:

ЗДРАСТВИ СРАВНАЯ СТАРИЦЦА
СЕРЦЕ РОДИНИ МАСКВА
ФСЯ СТРАНА ТАВОЙ ГАРДИЦЦА
ГОРАДАФ РАДНИ ГРАВА
РУСЬ ВЕРИКУЮ СПРАТИРА
ТУ ВАКРЮГ ТУВЕРДУНЬ КРЕМРЯ
И АКРЕПРА НАСЯ СИРА
И ПРАСРАВИРАСЬ ЗЕМРЯ

Вот оригинал.

Здравствуй, славная столица,
Сердце Родины -- Москва!
Вся страна тобой гордится,
Городов родных глава.
Русь великую сплотила
Ты вокруг твердынь Кремля,
И окрепла наша сила,
И прославилась земля!

Подробнее см. загадка
http://speakrus.narod.ru/21/f2184.htm#2 (последний пункт в постинге)
и разгадка
http://speakrus.narod.ru/22/f2213.htm#6

Расшифровки аккадского слогового письма отдыхают!

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: mathusael 
Дата:   06-10-03 12:35

2 Арнольд
>>>> Подробнее см. загадка
http://speakrus.narod.ru/21/f2184.htm#2 (последний пункт в постинге)
и разгадка
http://speakrus.narod.ru/22/f2213.htm#6

Да, примерно так это, вроде бы, и выглядит... Вот только я очень сомневаюсь, что японец, поняв как это _должно_ бы читаться, сумеет _прочитать на японском_ весь этот винигрет из совершенно несвойственных японскому сочентаний из подряд идущих согласных, палатализации и закрытых окончаний... "Сплотила" он всё равно будет читать как "сўпўратира", "вокруг" - "вакўрўюгў" ну и так далее. (Может о вместо а, о-краткое вместо ў, или там а/я, у/ю, о/ё, но это детали)

Отец одной моей знакомой дамы, весьма грамотный японист, во время войны работал на "контроле открытого эфира". Сиречь - ловил по всему миру, кто и о чём по радио говорит открытым текстом. Не помню, как эта должность точно называется, она и сейчас в органах существует. Так вот, неожидано поймали отрывочное сообщение, что-то типа испытания нового оружия "на полигоне под Уядзимой". Подобные новости летели на стол к начальству незамедлительно. Но Уядзимы на карте не нашли... Только под утро сообразили, что речь шла о Вязьме. А можно было и под трибунал...

А "Москва" по-японски - Масукава (Масукува). Это еще ничего... Владидосток - Урадивасотоку.

ЗЫ Блин, что у меня с Инетом сегодня?!?!?! Сайт глючит или или провайдер? На других сайтах без особых проблем, а gramota словно уперлась. Я этот текст три раза набирать начинал, пока не догадался в ворде сохраняться. ;0(((

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   06-10-03 21:19

Кстати, о птичках. то бишь о распознавании текста компьютером.
Если кто ещё не заметил (о, счастливчик!), Центр Американского Английского придумал "новый" простенький метод маскировки спама: в текст письма просто-напросто случайным образом вставляются знаки препинания. И Яндекс.ру это пропускает даже не в "Рассылки", а прямо в "Полученные"!
Хотя противоядие прямо-таки напрашивается -- удалить из письма ВСЕ символы, кроме букв русского алфавита. Если письма совпадают, значит это -- спам...

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Ilyich the Toad 
Дата:   07-10-03 21:20

Dend сказал:
>
> Кстати, о птичках. то бишь о распознавании текста компьютером.
> Если кто ещё не заметил (о, счастливчик!), Центр
> Американского Английского придумал "новый" простенький метод
> маскировки спама: в текст письма просто-напросто случайным
> образом вставляются знаки препинания. И Яндекс.ру это
> пропускает даже не в "Рассылки", а прямо в "Полученные"!
> Хотя противоядие прямо-таки напрашивается -- удалить из
> письма ВСЕ символы, кроме букв русского алфавита. Если письма
> совпадают, значит это -- спам...

Счастливый вы человек! Вы ещё не заметили, что в спаме употребляется "случайное" включение прописных, "случайное" смещение пробелов, "довески" из нескольких букв в конце строчки и т.п. Тут ваше противоядие, УВЫ, не сработает.

Увы, спамеры, мать их, не дремлютЬ. Повбывав бы. Всех. На.

Одно хорошо - вот я лично гружу только заголовки писем, да и то после выбраковки автоматическими фильтрами (которые я же и настраивал), так что на бабки типа не шибко попадаю...

Ответить на это сообщение
 
 Довыпендривались...
Автор: mathusael 
Дата:   08-10-03 19:35

В номинации "лучший анекдот недели" на www.Fomenko.ru первое приз получил следующий. (данные на 02.10.03)

По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все

ЗЫ То ли на то ли на фоменке есть большие любители грамотных анекдотов, то ли на грамоте - анекдотичных фоменок.

Ответить на это сообщение
 
 Re: По результатам исследований...
Автор: Dend 
Дата:   08-10-03 20:53

2Ильич:
> ... употребляется "случайное" включение прописных, "случайное" смещение пробелов, "довески" из нескольких букв в конце строчки и т.п. Тут ваше противоядие, УВЫ, не сработает.

Кстати, Вы не учли ещё один вариант:
IF (letter="с") THEN (переключать RU-EN случайным образом)

Тады предлагаю поправку:
0)Транслитерировать всю латиницу
1)Удалить все символы, кроме букв русского алфавита
2)Превратить все прописные в строчные
3)Отрезать первые и последние N символов

Я понимаю. что шизобретаю лисапет, но... "Это удалось ему потому, что он не знал, что это невозможно".

Ответить на это сообщение
 форумы  |  свернуть  |  начало  |  к началу   назад  |  вперед