Русский язык - Справочно-информационный портал Вече - словари-никударики

Конференции

Конкурсы

Олимпиады

О портале

Вече

форумы | новая тема | начало | к началу | поиск | войти

назад | вперед

словари-никударики

Автор: adada
Дата: 02-08-07 12:08

Формат этого форума не очень удобен для академического или хотя бы "академического" рассмотрения вопроса о "Частотно-вариативном словаре русского языка". Важно другое: хотя идейка о таком словарике подбрасывалась и в ряде других мест, сторонников она почему-то не нашла. (Настоящих сторонников, образованных и энергичных, которые могли бы закономерно оттеснить закоперщика!)

Я не склонен примыкать к утопистам, поэтому продолжаю доискиваться, а почему эта вроде бы самоочевидная вещь до сих пор не вылупилась из примитивистского яйца и не стала плодиться и размножаться? Понятно, что цехового интереса к ней может и не быть, но неужели никто не пожелает состряпать на тему частотности/частости кое-какое исследованиеце, влекущее какое-нибудь званьице?

Увы, "с тихим криком никударики в навсегданьице летят..."

+
Думаю, что вопрос это не чисто механически-методически-лингвистический. У него есть толстенький философско-антропологический корень, проросший в языке-сознании, этом нашем видовом признаке...

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: Фёкла. Просто Фёкла.
Дата: 02-08-07 12:42

> почему эта вроде бы самоочевидная вещь до сих пор не вылупилась из примитивистского яйца и не стала плодиться и размножаться?<
Наверное потому, что ценность такого исследования приближается к абсолютно малой величине. Как та, средняя по госпиталю, температура.

Ответить на это сообщение

Эх, словари-фантомы...

Автор: Gapоn
Дата: 02-08-07 13:02

Сударыня, кажется, Вы не правы. Частотность (видимо, статистика использования в речи?!) вооружит спецов псевдонаучным инструментом, что уже неплохо в нынешних условиях. Волюнтаристское "Жалааааю!" некоторых будет слегка сдержано...

Но реальности осуществления подобного иссследования не вижу даже в перспективе. Ну, так я - не лингвист!

Ответить на это сообщение

Re: словари-никударики

Автор: Фёкла. Просто Фёкла.
Дата: 02-08-07 13:37

И в этой статистике будут смешаны говор погонщиков севрных оленей и ишаков жаркого Туркестана.

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 13:48

В идеале - должны непременно! Но именно широта "неохвата" и смущает меня, заставляя принимать эту идею за утопию...

Или Вы, подобно некоторым тут и выше, откажете оленеводам Туркестана в праве говорить на РЯ?

Ответить на это сообщение

Re: словари-никударики

Автор: *мираж
Дата: 02-08-07 13:50

>откажете оленеводам Туркестана в праве говорить на РЯ?

Браво!:)

Ответить на это сообщение

Re: словари-никударики

Автор: VFG
Дата: 02-08-07 13:54

>> И в этой статистике будут смешаны говор погонщиков севрных оленей и ишаков жаркого Туркестана.

Не, у Фёклы ещё бравее вышло: говор ишаков.:)

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 13:55

А фигли?! Самое "о-то-то".. Иначе начнут тут сейчас снобировать про "нерепрезентативность выборки", "нестрогий подход к методологии"... так и договорятся до низкого качества тех или иных "носителей". Знаем-с!

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 14:07

Доселе чувствовалось влияние "властелинов-погонщиков" Садового кольца...

Но, как часто сегодня советуют, вериги фанатизма лучше отбросить и начать с будто бы малого, например:
-- убрать на фик морализаторские пометы из словарей, заменив их сведениями о частотности;
-- вытряхнуть из разных находчивых скворцовых их находки типа "не дОговор, а договОр", выделить из них семантически тождественные пары и по ним произвести первоочередной статанализ.
И так далее.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: *мираж
Дата: 02-08-07 14:09

>Не, у Фёклы ещё бравее вышло: говор ишаков.:)

Была же валаамова ослица,
Ершовская ночная кобылица...
Чем не носитель говора ишак?
Конечно, вряд ли будет как Бальзак,
Но все же Нассреддин взялся за дело...
Вот Фекла бы теперь не околела!

"Фекла" это только к нику! Я бы никогда не посмела так баловаться с живым именем. В любом случае, простите, если покоробит.

Ответить на это сообщение

Re: словари-никударики

Автор: *мираж
Дата: 02-08-07 14:10

Насреддин

Ответить на это сообщение

Re: словари-никударики

Автор: sad
Дата: 02-08-07 14:12

*мираж, не стОит поправлять.
Ведь он же среди нас опять -
И снова, и всегда, и нет ему замены :)

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 14:16

Утопия. Кто же из "потомков" г-на Беликова пойдет на это?! Им же удобнее "Как бы чего не вышло!" приравнять к увесистому "Тащить и не пущать!"... Тут тебе и пресловутые "званьица", и прочая мелочь красивой жизни!

Поэтому с технологией придется подождать, а все усилия направить на получение "Одобрям-с!"...

Ответить на это сообщение

Re: словари-никударики

Автор: VFG
Дата: 02-08-07 14:24

>> убрать на фик морализаторские пометы из словарей, заменив их сведениями о частотности;

adada, а как Вы эти самые сведения предполагаете получить?

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 14:46

Ту желающим реформ РЯ:

Уже понасреддинили изрядно...
Материалу мало? Что с того?!
Берем "и-а" в глаголы - будет складно!
и хитрую частицу "И-го-го!"...

Добавим междометий и - в печать.
Ученикам - страдать. А мне.. мне - ржать.

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 14:58

Попробуем вообразить.

Статьи с вариационными пометами из словарей извлечь несложно. Скорее всего существующих электронных версий для этого уже будет достаточно. (Первую сотню можно взять из ададского "Пособника язычника"... :))
С фразеологией несколько сложнее, но мне кажется, что анализаторов текста по заданным признакам уже наваяно.

В результате мы получим массив ЧИ, "что искать". Причем современные программные средства могут легко представить его и в цифровой , и в аналоговой форме. Например, у меня на "луксе" есть пара прог, которые читают любой текст, восстанавливая его из слоговых кирпичиков.

Массив ГИ или "где искать" в условиях безгрантовости придется брать выборочно из существующих "народных" аудиозаписей: лекционных, парламентских и т.п. Оценка их репрезентативности может быть произведена с использованием существующих социологических схем.

Затем пишется, насколько я представляю, довольно несложная компараторная программа, затем ▬ enter и enjoy.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: *мираж
Дата: 02-08-07 15:01

...И ржаньем тем сразил всех наповал
Наш местный грамотейский Буцефал:)

Ответить на это сообщение

Re: словари-никударики

Автор: Cocpucm
Дата: 02-08-07 15:02

Методику в принципе поддерживаю. Два замечания по существу:
1) проводить обследование надо среди всех (или делать репрезентативную выборку), для кого родной язык, по их мнению, - русский (пусть даже в действительности это будут переходные говоры);
2) при таком опросе надо будет снимать тенденцию респондентов говорить "как надо", а не как они говорят обычно.

Другой вопрос - очень сомневаюсь, что это будет нормально реализовано на практике. Ведь подобный вопрос потребует огромных человеческих и финансовых ресурсов; да и похоже, что наши "нормализаторы" (я не про здешних обитателей, а про составителей словарей) выскажутся резко против: ведь данное мероприятие у них "хлеб" отнимет.

P.S. Жаль, что интересная тема в который раз погрязает во флуде...

____________________________________
De omnibus dubitandum (c) F.W. Nietzsche
Уже НЕ Борода

Ответить на это сообщение

Совершенно нерепрезентативно!

Автор: Cocpucm
Дата: 02-08-07 15:07

> Массив ГИ или "где искать" в условиях безгрантовости придется
> брать выборочно из существующих "народных" аудиозаписей:
> лекционных, парламентских и т.п. Оценка их
> репрезентативности может быть произведена с использованием
> существующих социологических схем.
Сомневаюсь, что от такой фактической базы можно будет добиться репрезентативности. Во-первых, частотность определенных слоев населения не совпадет с их частнотностью на записях. Во-вторых, опять же возможен риск получить более "правильные" результаты (т.е., в условиях записи человек может осознанно следить за своей речью с оглядкой на заданную нормативность).

____________________________________
De omnibus dubitandum (c) F.W. Nietzsche
Уже НЕ Борода

Ответить на это сообщение

Удачи!

Автор: VFG
Дата: 02-08-07 15:08

>> Попробуем вообразить.

Представляю себе, какой это труд! Но мне все равно как-то не верится, что в результате этой титанической работы получится нечто действительно достоверное. Особенно, если рассматривать вот этот массив "ГИ".

Но стремление, конечно, похвальное. Если Вы настроены решительно, желаю удачи!

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 15:16

Хотя форум и глоттологический, но замыкаться на локальных языковых аспектах вряд ли целесообразно. (Хотя и здесь кто-то может найти себе экспериментальную нишу, которую и расширить можно было бы, и углубить, были бы деньги. Грант на сцену!)

Поэтому есть смысл погнать социальную волну, и совсем не провокационную! Конечно, у общества проблем выше крыши и языком его обольстить непросто, но все-таки каждый из нас множество раз сталкивался и стакивался с другими людьми по вопросам правильности, ортологичности речи или письма, часто нервничал при этом, что мысль о ненужности, неполезности этого мутного источника межличностной напряженности внедрить в массовое сознание будет не так уж и сложно.

Бросив эту "девку в полк", можно ожидать, что она там бесследно не пропадет! Возникнет -- возможно! -- общественный интерес, а за ним и сформируется представление об общественной же пользе. Такой вот технологический прием...

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 15:33

"Канувший пост 26-07-07 16:53"
Автор: Фёкла Мудрищева (---.AVK.87.118.221.32.0xffffffe0.macomnet.net)
Дата: 02-08-07 15:13
%%...выбить всю почву из-под ног теории "частотной нормативности"...%%

Написали бы уж: выдуть, почва-то пока только песчаная!

Само собой, я к Вам прислушиваюсь и благозвучные обертоны вылавливаю. Но сочетание частотная нормативность" -- режет слух, и применяете Вы его явно самозабвенно, если не тенденциозно, т.е. сообразно собственному (женскому? по Цветаевой?) "вероломию"...

На самом деле предлагаемая "частотная лингвоспектроскопия" предусматривает дезнормативность, но не произвольную, а математически обоснованнную. Если высказывающийся стремится выразить свою мысль наиболее вероятно понятным образом, то и средства для ее выражения он очевидно выберет соответствующие. Что толку излагать свои мысли идеализированным литературным языком, если аудитория этим языком не владеет? Опытный оратор это прекрасно знает и средства выражения подбирать умеет. А неопытный? Последнему-то и требуется помощник, которым вполне может оказаться частотный словарик, покуда никударик.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Волюнтаристский "гапонизм"

Автор: Gapоn
Дата: 02-08-07 15:33

Пусть не шокируют языковедающих мои вопросы и предложение!

1. "Частотность", это - ковыряние во всем языковом массиве или только в лексике носителей, которую здесь недавно определили размером в 300-3000 слов?

2. Или речь идет только о спорных случаях типа "звонит" и "договор"?

В любом случае предлагаю тсз "инверсионное" исследование: сидя в пределах Сад.кольца получать по почте от носителей заранее объявленный текст с пометами ИХ ударений. Очевидно, что это будет не Библия, а что-то из детской литературы, к которой претензий нет... Дальнейшая обработка - сравнительный пустяк.
Понятно, что потребуется протекция для придания статуса этой авантюре статуса "федеральной программы"; тут уж нужен только Кремль, а не РАН и ее спецы. Кто-то наверху легко захочет сыграть в это в "год РЯ"... да и бюджет - минимален...

Ответить на это сообщение

понемногу, но часто

Автор: adada
Дата: 02-08-07 15:40

'Gapоn', могу высказаться только от имени языколожествующих.

Концептуально идея должна распространяться на язык в целом, предположительно, с модификациями в его разделах. Но на стадии тестирования ее, естественно, следует опробовать на избранном, на животрепещущем, тем более сбором примеров такого рода давно и усердно занимаются и официально, и любительски множество людей.
Но и в последнем (т.е. в наипервейшем) варианте результат обязательно должен носить динамический характер, категорически исключающий превращение устарелой версии частотного справочника в догмат.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 15:51

:)) Между "настроен решительно" и "решительно настроен", увы, пропасть, неглубокая, но ададой не преодолимая...

2 'Борода aka Cocpucm'
%%Сомневаюсь, что от такой фактической базы можно будет добиться репрезентативности.%%

Прошу прощения, и в этих словах мне видится ползучая нормативщина...
Какими бы ни были относительными выданные в результате обсчетов результаты, главное, они будут дистанцированы от кодифицирующих норм литературного языка, который мы с вами уважаем, но довольно остраненно, поскольку нормальный человек, не обремененный смежной или прямо относящейся к языку профессией, никогда и ни за что не будет учить наизусть три тысячи сто дявяносто четыре параграфа.

Частотный словарь в любом случае станет опорой для такого нормального, неанархического человека, основой для его потребностей в лексических вариациях-девиациях.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 16:11

Спасибо за разъяснение, но оно еще сильнее опечалило меня. По сути, Вы хотите создать новое направление в российской лингвистике (или как она там сейчас именуется), да еще и посадить его на гос.финансирование. Не имея в виду субъективные факторы (сами знаете, порою - непреодолимые!), чуйствую, что в это время в этом месте такое не проканает никак. 2-утопия-2, увы.

А волонтерам из числа любителей и хранителей языка это не осилить по причинам хотя бы техническим и организационным. Все опять сведется к потугам жалкой фракции обитателей Сад.к. А их легко кончит любой "оппонент".

Ответить на это сообщение

Re: словари-никударики

Автор: ГАВАНА
Дата: 02-08-07 16:22

Развейте кто-нибудь мои сомнения в конце концов, спрашиваю второй раз: а разве словарей частотности раньше не было? Вот прям как сейчас помню, что держала его в руках, брала на "наших", русских, стеллажах в библиотеке моей старой работы. Помню, что не поняла ничего, но мне и не надо было, просто хотела посмотреть - что же это вообще такое. Может, в советские времена они были?
Труд, конечно, огромный. Проще освоить отпущенные на РЯ средства, устроив повсеместно какие-нибудь "Сибирские/Яхонтовые бирюльки/веретёна".

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 16:28

ГАВАНушкА, Вы уже и себе не верите?! Если держали в руках, значит - было. Эка, заморочили Вас здешние турусы!..

Из прошлого помню только то, что последнее в совке (до конца 80-х) издание Салтыкова-Щедрина было в 1949 г. Во как опасен он был!

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 16:36

Чего ж тут печалиться, не король ведь умер! Максимум, в исторической туманной дымке -- дофин. Но мне кажется, что программные средства для выполнения расчетов уже существуют, эта область развивается непрерывно и для посторонного наблюдателя незаметно. Я можно сказать офонарел, увидев исключительно маленькие размеры "программы LingvoSoft Talking Dictionary" читающей английские, русские и прочие слова без никакой базы этих самых слов!

Кстати, если уж фантазировать, то нетрудно представить программное средство, "на лету" корректирующее орфоэпические ошибки телеведещего... А уж анализ-то сделать -- вообще плевое дело... Завтра будет.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: Gapоn
Дата: 02-08-07 16:40

Ну, дай Вам бог!

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 16:44

Были такие источники. И я держал в руках книгу: Граудина Л. К., Ицкович В. А., Катлинская Л. П. Грамматическая правильность русской речи (Опыт частотностилистического словаря вариантов). М., 1976. Жаль, его еще никто, кажется, не сканировал и не вбросил...

Но из следующего издания этого замечательного справочника все статистические данные испарились, деньги кончились, то-се... "Кончается терпение Господне!.." :))

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: ГАВАНА
Дата: 02-08-07 16:53

Та-а-к! Ну и что же все эти сожаления означают? Вот здесь написано, что существует 5 словарей частности:

http://www.friends-partners.org/partners/orient/events/hisour98/kasevich.htm

Ответить на это сообщение

Re: словари-никударики

Автор: ГАВАНА
Дата: 02-08-07 16:58

А вот с Грамоты, трехлетней давности, так и называется - "словарь частотности:

http://www.gramota.ru/forum/read.php?f=1&i=12632&t=12620

Ответить на это сообщение

Re: словари-никударики

Автор: Cocpucm
Дата: 02-08-07 17:10

adada сказал:
> 2 'Борода aka Cocpucm'
> %%Сомневаюсь, что от такой фактической базы можно будет
> добиться репрезентативности.%%
> Прошу прощения, и в этих словах мне видится ползучая
> нормативщина...
Ни в коем разе!
Просто по предложенной методике Вы получите (я не специалист; посему мне трудно оценить, насколько реально сие реализовать) скорее не частотный словарь собственно русского языка, а скорее частотный словарь языка русской "интеллигенции" и госслужащих... причем, со стремлением к нормативности и к "Садовому кольцу" ;-)

____________________________________
De omnibus dubitandum (c) F.W. Nietzsche
Уже НЕ Борода

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 17:13

Трудно сказать, содержат ли словари, известные Венцову и Касевичу, "неправильные", "нерекомендуемые" слова, или в их корпус включены только нормативные варианты. Хотя если работа этих авторов направлена на моделирование (и распознавание) речи, то "отклоняющиеся" варианты непременно должны быть в них учтены. И сопровождены параметром их веса.

Аналогичные соображения могут быть высказаны и по поводу грамматических единиц и структур.

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 02-08-07 17:52

Далее, слегка продвинувшись по ссылке от 'ГАВАНА', находим следующие полезные для у-утопистов сведения из докладов "Корпусная лингвистика-2004":

"Работы в рамках проекта RussNet показали, что необходимо верифицировать данные готовых словарей относительно корпуса текстов, ограниченных определенными временными и жанровыми рамками, поскольку часть словарной информации представлена довольно непоследовательно. Было принято решение о построении ядра компьютерного словаря на базе корпуса современных текстов. Этот период, на наш взгляд, начинается с середины 80-х годов (конца "советской эпохи") до настоящего времени. В жанровом отношении в корпусе превалируют тексты, обладающие усредненными значениями информативности и экспрессивности.

Одним из базовых принципов построения wordnet-тезауруса является перечисление значений слова в соответствии с их частотным распределением в корпусе текстов. Этот принцип позволяет также отделить окказиональные значения как такие, которые употребляются менее, чем в 1% случаев для нашего корпуса, состоящего из 21 млн словоупотреблений. При этом структура значений толкового словаря, в частности, МАС, используется как первоначальная схема разграничения смыслов в представительной выборке контекстов слова. В дальнейшем лексико-семантические варианты (ЛСВ) слова упорядочиваются в соответствии с их частотностью употребления.

При формировании "синсетов" (синонимических рядов слов, выражающих некоторое значение) частотность употребления используется для упорядочения элементов синсета: выделяется "доминанта" - наиболее часто используемое нейтральное слово для выражения лексикализованного понятия - и второстепенные элементы синсета, которые существенно уступают доминанте в частоте использования."

===

"В Лаборатории моделирования речевой деятельности в течение ряда лет ведутся работы по созданию Национального корпуса русского литературного языка. В корпус включаются письменные (опубликованные) тексты, датируемые с начала 50-х годов ХХ в. и по настоящее время. Примерно в равных объемах представлены художественная литература, научные (научно-популярные) тексты, публицистика и драма. Корпус служит основой для составления частотного словаря (точнее, частотных словарей), в дальнейшем, как предполагается, корпус выступит источниковой базой для нормативных грамматик и словарей русского языка, для семейства справочных пособий, равно как и для решения существенных проблем моделирования речевой деятельности."

===

"В WordNet словарными статьями являются синсеты - множества слов-синонимов, обозначающих один и тот же концепт в заданном контексте. Каждая словарная статья имеет толкование, не допускающее неоднозначного понимания. Для синсета явно указываются часть речи и толкование. Каждое слово, входящее в состав синсета, может дополнительно иметь ряд атрибутов, например, признаки доминантности, пометы типа "идиома", "близкое значение" и т.д. Для каждого слова может быть приведен пример его употребления в заданном контексте - определяется набор речений и фразеологизмов, также определяются толкования.

В настоящее время русский WordNet включает:
1) 45424 существительных, образующих 53791 синсетов;
2) 29421 глагол, образующий 29471 синсетов;
3) 21317 прилагательных, образующих 25811 синсетов;
4) 5147 наречий, образующих 5181 синсетов;
5) парадигмы для всех лемм словника;
6) определение словообразовательных отношений;"

______________________
adada-inn & адада-съют

Ответить на это сообщение

Re: словари-никударики

Автор: adada
Дата: 03-08-07 10:04

Буду понемногу собирать здесь осколки.

"Канувший пост 26-07-07 16:53"
Автор: ГАВАНА
Дата: 02-08-07 18:30
%%Малограмотность - не порок, а всего только недостаток, причем поправимый.%%

Сопроводив традиционные словари числовыми данными о вариациях, мы можем приблизиться к количественной оценке "малограмотности".

______________________
adada-inn & адада-съют

Ответить на это сообщение

форумы | свернуть | начало | к началу

назад | вперед