Мета-язык

 

 Не успел сказать о главном аргументе. Оправданием восстановления второго элемента в базовом двухкомпонентном сообщении является то, что второй, действительно, элидируется. Ну, как в Ночь. Улица... Поставим в прошедшее время и поймем, что глагол был просто элидирован. А в речи детей нет никакого прошедшего времени, никакой парадигмы. Там нет никакой структурной аналогии, которая бы позволила постулировать второй элемент.
 

 У меня 50%... начал кое-что подозревать о Платонове =)

Александр Калинин, мне нравится Ваше предложение, но прежде чем выбрать какой-нибудь подход, интересно узнать, почему выбирается именно он =) Почему бы в создании мультиязычных документов не сосредоточиться на автоматическом синтезе в ущерб автоматическому анализу?

Что имеется ввиду: если я правильно понял, трудность в создании мета-языка состоит в анализе текста на естественном языке. Это вещь незаменимая если подходить к переводу с позиции - "хочу понимать что говорят другие". Но более полезным с практической точки зрения, ИМХО, может оказаться подход "хочу сказать чтобы другие поняли". При таком подходе точным анализом можно пренебречь, зато важно сделать точный синтез =)

Интересно узнать, а у точного синтеза ровно такие же проблемы?

Как можно было бы развивать точный синтез - написать программу в которой можно было бы конструировать хотя бы простые предложения, но которые она могла бы переводить по крайней мере в несколько языков сразу довольно точно.
Пускай она бы работала не с текстом на естественном языке а с какими-нибудь другими конструкциями - пример:
"верни деньги" - и описание как перевести - вежливо (будьте добры погасить задолженность), вежливо-настойчиво (верните пожалуйста деньги), настойчиво (верни деньги), грубо (неси деньги, быстро!) ну и т.д.
И её уже расширять при необходимости. А еще лучше сделать расширяемой и открытой.

При таком подходе мета-язык мог бы напоминать языки разметки - вроде tex или xml, а мультидокумент вроде

xmlns:g="">






преобразовывался бы в "неси деньги, быстро!" (причем для своего правильного отображения документ требует применить дополнительный сторонний модуль расширения "gangsta" с www.gangsta.com - каждый может добавлять возможности при необходимости).

Причем база для написания таких программ уже разработана - часть синтеза в автоматических переводчиках. Требуется только грамотно и удачно отделить ее от анализа =)

Документы на таком языке, конечно, были бы кошмарными для верстки поначалу, но тем не менее с помощью такого инструмента уже можно наладить уверенное общение с автоматическим переводом. А в перспективе могли бы уже появиться помощники в духе программ анализа "сама догадаюсь что Вы хотите сказать" =)

С более общей позиции - если разнообразие естественного языка не вписывается в мета-язык, нужно вписать наоборот - мета-язык в естественный язык и сделать мета-язык достаточно мощным для практических целей.

Утопично? =)
 

 Александр Барулин, посоветуйте пожалуйста, если Вас не затруднит, какую-нибудь литературу для ликбеза (желательно на русском), очень хочется понимать о чем Вы говорите, хотя бы на примитивном уровне =)
 

 Простите великодушно, в мои планы совершенно не входило, чтобы меня не поняли. Литература очень большая, мне все-таки много лет и всю жизнь я читаю. Лучше задайте вопрос, любой, например, что означает слово Х, или что Вы имели в виду, когда писали .... Я Вам все объясню. Просто Александр Калинин мой коллега, филолог, я и расслабился. Извините
 

 Понимать и воспринимать - разное. Александр, как кажется, - не воспринял, я же Вас - не понял. Далее я формулирую свое непонимание.
Во-первых, "всякое науное изыскание - не более чем модель". Как это понимать. В этом предложении любое слово не несет в себе никакого смысла. Понимаете, есть разные абстаракции, даже на уровне обобщений. Мат. формула - это абстрактное обобщение, из которого развертывается бесконечное число частностей, мат. формула может быть названа порождающей моделью, если под последней понимать единожды данный единораздельный принцип порождения; другой род обобщений - абстрактное обощение в виде схемы. Это когда тот же У. Эко в одной из своих книг рисует структуру в виде палки и четырех, особым образом прикрепленный перекладин, и говорит, что такой момент обощения позволяет выявить нечто общее между человеком и деревом, а именно - схожую структуру того и другого. Понятно, что такое обобщение и такая модель - пустая бессмыслица, схожая в этом отношении с вашими словами.
Термин модель, если брать истоки его в лингвистике, стал употребляться Хэррисом, разрабатывался Хоккетом, Хомским, Эттинджером, и к 70-м годам насчитывал несколько десятков пониманий (отсылка к работе А. Ф. Лосева "Введение в общую теорию языковых моделей"). Либо Вы даете Вашу собственную мысль, в которой бы слово "модель", будучи включено в контекст вашей мысли, как-то понималось (во всех моих сообщениях такое мое понимание прослеживается), либо занимаетесь терминологическими исследованиями, который здесь невозможно разворачивать, ну и третий вариант - абсолютно неприемлемый - вы говорите слова, не имеющие никакого контекстуального смысла: "Всякое научное изыскание - не более чем модель объекта описания" - ничего не говорящая фраза.
Второе. Не нужно обвинять человека в том, что он строит конструкты. Вопрос в том, что это за конструкты. Если это структура У. Эко то -извините - на помойку такие конструкты. Если универсальный язык такой же конструкт, то он представляет собой очень малую ценность. "свойства модели зависят от того, кто строит, и от задачи, которую человек решает" - это одностороннее непонимание, модель находится в более сложных отношениях к объекту. Наука описывает совй объект - хорошо. Математика, когда таблицу умнжения выводила, какой объект описывала? И таблица умножения - это что за модель-конструкт, и как это она-он интересно зависит от математиков. Это какой-то номинализм, в средневековой своей форме.
Третие. Метаязык - это поиск общеязыковых универалий. Никаких общих универсалий для всех языков не существует. Вбирание сказуемого в подлежащие в одних языках, и обратное вбирание в других языках, делает весьма сомнительной схему "подлежащее-сказуемое" в качетсве универсалии. См. работу Robinson I. The new grammarians funeral: A critigue of Noam Chomskys linguistics (1975), там сказано, что "единственной языковой универсалией является сам язык".
Вы действительно не видите первостепенность этой проблемы по отношению к возможности создания переводчика, который бы работал на основе конструкта метаязыка?
Четвертое. "Смысл ... уж точно существует вне языка" Вы не знакомы с базовыми трудами по философии языка (Жак Деррида и Жиль Делез, прежде всего, так же Л. Гоготишвили "Непрямое говорение", где проводится сопоставление различных взглядов на отношение языка и смысла). Никакого смысла, отделимого от языка не существует. Если же это конструкт - то он абсолютно бесполезен.
Пятое. Мне не требуется никаких профессиональных навыков и образований, чтобы задавать вопросы в любой области. То что пишете Вы, я воспринимаю безо всяких проблем на элементрано-простом языке. Наука начинается не с конструктов, описаний всех мнений, реконструкции того, кто что где сказал, - она начинается с вопроса.

 

 Александр Калини, я знаю людей, который работали над программами распознавания текста, у них многое получалось и многое работало, только остаются предельные вопросы, не решив которые нельзя будет создать никакого универсального переводчика.
Когда я говорил, что машина не распознает образ, я не имел ввиду того, что машина не может выполнять каких-то операцию по вычленению букв письма и т. д. Ваша формализация - всегда ваша, а язык может быть формализован только ограниченно, человеческий язык в сообщаемых через него смыслах не формализуется в принципе. В этом же отношении я всегда считал, что калькулятор не может считать...
Простите, я, верно, очень плохо объясняю.
Вы просто подумайте.
 

 Александр Барулин, что значит "элидируется"? И что Вы имели ввиду под "Оправданием восстановления второго элемента в базовом двухкомпонентном сообщении является то, что второй, действительно, элидируется"? И еще интересно в каком возрасте происходит переход на двухкомпонентные сообщения? =)
 

 Глагол элидировать - того же корня, что и эллипсис. Эллипсис - операция сжатия текста (предложения) для экономии времени его произнесения, при которой опускается какой-нибудь член предложения или группа членов предложения, понятных из контекста и легко восстановимых, например: он - в автобус, я за ним. В этих предложениях опущено сказуемое, семантика которого легко восстанавливается. Эллипсис бывает факультативным и обязательным, грамматическим. В блоковском "Ночь. Улица. Фонарь. Аптека" все эти предложения стоят в настоящем времени. Связка в таких предложениях должна быть опущена. Но, если предложение (с тем же смыслом) должно стоять в прошедшем времени, там должен появиться глагол. "Была ночь"... На этом основании лингвисты делают вывод, что в такого рода предложениях опущен глагол-связка, при этом предложение - все равно двусоставное. В детском языке все не так. Переход на двусоставные предложения происходит в начале второго года жизни, хотя у разных детей это может быть сдвинуто в ту или другую сторону.
 

 Кириллу Родину. Во фразе, с которой Вы начинаете - Всякое научное изыскание - не более чем модель объекта описания - под изысканием здесь имеется в виду его результат, а не процесс. Результатом научного изыскания является интерпретация (результат) исследуемого объекта в терминах разработанного в науке метаязыка, который уже сам по себе является инструменом для построения моделей (как, в общем и научный язык). Поскольку объект исследования интересует исследователя всегда (!) только в определенных аспектах, он заменяется в исследовании на модель, т. е., например, на совокупность измерений объекта, представляющих интерес для исследователя. Скажем, когда в физике исследуется ускорение при падении тел на землю, процесс падения в естественной среде заменяется на процесс падения в безвоздушном пространстве для того, чтобы устранить трение. В искусственных условиях проводятся химические эксперименты и т. д. Но и здесь надо учитывать, что во всем сложном процессе падения исследователя интересует только один параметр - ускорение. От всех прочих он отвлекается. Лингвисты для исследования свойств предложений вырывают их из контекста, а нередко и вообще выдумывают из головы, упрощая его до тех параметров, которые их интересуют. Только самоубийцы и начинающие безумцы в науке готовы проводить эксперименты с чистым природным явлением, а не с препарированной его моделью. Обычно же мы имеем дело с параметром явления, описанным на метаязыке данной науки. Результат научного исследования также формулируется в терминах метаязыка, следовательно этот результат является метаязыковой моделью даже не объекта, а его препарированной модели. Что здесь непонятного я, убей Бог, понять не могу. Методом последовательной аппроксимации (приближения к оригиналу) человек добивается все более и более адекватного отображения в метаязыковом виде отображаемого объекта. Научное исследование - это искусство моделирования, которое позволяет исследователю что-то понять об объекте. Схема Умберто Эко - вполне интересный объект для осмысления, если уметь ее интерпретировать. Если же Вы не умеете, не стоит горячиться и обвинять Эко в том, что он занимается полной ерундой. В конце концов он делает это не на Ваши деньги, а на деньги итальянских налогоплательщиков. моя фраза о том, что результат научного изыскания есть интерпретация объекта в терминах научного метаязыка, а это - модель объекта, для Вас пустой звук, потому что вы не понимаете этого термина. Математики изучают числа (очень сильно упрощаю для Вас ситуацию). Число - удобный абстрактный объект, имеющий ограниченное число свойств, а потому удобный материал для построения моделей реальных объектов и отношений между ними. Но число - тоже объект иррациональный, объект, который напрямую изучать невозможно. Понятие числа до сих пор не определено, а математики постоянно спорят о том, что считать числом, а что - нет. Скажем, трудно представить себе, что такое корень из минус единицы. Для объяснения важности роли наблюдателя в любом виде научных изысканий привожу Вам цитату из работы великого математика ХХ в. Джона фон Неймана:
 

 уважаемые господа, я обязательно продолжу нашу интересную дискуссию на выходных. пока что у меня тут идет череда праздников , которая не дает мне сосредоточиться 8).
однако, предлагаю не вносить в дискуссию о мета-языке полемику о детских речевых явлениях, предлагаю вынести ее в отдельный топик. уверен, что эта тема тоде очень благодатна для споров, и там тоже будет очень интересно.
Александр kaval Каваленков, я конечно не профи, но могу с уверенностью порекомендовать вам книгу А.А. Реформатского "введение в языкознание" для того, чтобы вооружится лингвистической терминологией и знаниями. лучше пособия по общей лингвистике я просто не знаю. если будут проблемы с поиском, пишите, я на почту вышлю. вам кстати дошло мое письмо с предыдущим текстом про МП?

 

 «Математические основания квантовой механики» (1955) он писал: "That is, we must always divide the world into two parts, the one being the observed system, the other the observer . . . . That this boundary can be pushed arbitrarily deeply into the interior of the body of the actual observer is the content of the principle of the psycho-physical parallelism - but this does not change the fact that in each method of description the boundary must be put somewhere, if the method is not to proceed vacuously." ‘Таким образом, мы должны всегда делить мир на две части: исследуемую систему и исследователя …То, что эта граница (граница между свойствами, навязываемыми системе исследователем и свойствами самой системы – А. Б.) может быть отодвинута произвольно глубоко в недра подсознания конкретного исследователя, является содержанием принципа психо-физического параллелизма, однако это не меняет сути дела: в каждом методе описания эта граница где-то должна быть проведена, если этот метод не создан, чтобы работать впустую’ (цит. по Pattee 1997, электронная версия (http://www.ssie.binhampton.edu), с. 7 (14 кегль)).
Это свое утверждение фон Нейман подкрепляет следующим логическим рассуждением. Пусть нам дана физическая система S, конкретное поведение которой определяется физическими законами, поскольку физические законы описывают все возможные способы поведения. Однако, если мы хотим измерить конкретные параметры поведения S, мы должны измерить начальное состояние S с помощью прибора М. Таким образом, существенной функцией измерения является порождение вычислимого символа, как правило, числа, соответствующего некоторому аспекту поведения физической системы.
Далее, прибор М также должен подчиняться физическим законам, естественно, и в процессе измерения тоже. Таким образом, с помощью законов физики мы можем корректно описать и поведение прибора. Теперь соединим систему S и измерительный прибор и представим их как новую физическую систему S = (S + М). Для того, чтобы предсказать, как будет вести себя новая система, мы должны прибегнуть к новому измерительному прибору, чтобы замерить начальное состояние S. Этот новый прибор мы вновь можем соединить уже теперь с S в новую физическую систему S и т. д.
Суть описанного мысленного эксперимента состоит в том, что функция измерения не может быть описана с помощью фундаментального динамического описания измерительного прибора, даже если подобное основанное на физических законах описание может быть достаточно детальным и абсолютно корректным. Суть в том, что физический прибор существует как физическая система и ничего больше, но для того, чтобы он исполнял функции измерительного прибора, он нуждается в исследователе, который должен выбрать, какие параметры физической системы проигнорировать, и обосновать выбор тех параметров, которые являются существенными для ее описания. Процесс отбора является результатом действий исследователя или организма и не может быть выведен из физических законов.
Подозреваю, правда, что и фон Нейман пойдет в отстой, как мы с Умберто Эко. Из этого, пожалуй надо сделать вывод, что объяснять Вам что бы то ни было - пустая трата времени. Кроме беспочвенных оскорблений - никаких результатов во взаимопонимании добиться будет нельзя. Для короткого завершения нашего заочного знакомства еще две фразы о Ваших утверждениях.
Мое определение модели:
 

 Пусть нам дан некоторый объект произвольной природы О и выбран некоторый эйдос объекта Е(О), отображающий существенные для взаимодействующего с ним субъекта, или биологической функциональной системы I, свойства объекта О, и пусть нам дан объект М и выбран некоторый эйдос объекта Е(М). Если теперь имеется система соответствий между простыми или сложными элементами Е(О) и Е(М), S(E(О) <==> E(М)), содержанием которой являются: 1) множество соответствий между элементами E(О) и E(М) и/или между конструктами, образованными из этих элементов и/или 2) набор правил, по которым строятся эти соответствия, и, на основании (1) и/или (2), программа взаимодействия с М для I при решении проблемы Р становится основой для построения программы взаимодействия с О, то М называется моделью О для субъекта или биологической системы I при решении ими проблемы Р.
О понятии эйдоса говорится раньше. Определения ему не дается. Скажу лишь, что под эйдосом объекта я в дальнейшем буду понимать нематериальные объективные свойства данного объекта, существенные для данных целей взаимодействия с ним живого существа или биологической функциональной системы (например, генома, клетки, мозга и т. п.). Дайте теперь Вы Ваше определение, чтобы можно было сравнить.
Все, что Вы сказали о метаязыке к науке не имеет никакого отношения. Универсалии естественного языка (далеко не полный перечень) собраны в пятом томе "Нового в лингвистике".
И, наконец, о смысле. Семантикой я так же занимаюсь профессионально. Это фундаментальная лингвистическая дисциплина. Вы опять не поняли того, что я сказал. Само выделение смысла в отдельный объект научного наблюдения - лишь гипотеза о ненаблюдаемом явлении, следовательно, опять научный конструкт, опять модель, причем модель, адекватность которой признается далеко не всеми исследователями. В этом смысле я и помещаю его в метаязык, а метаязык внеположен языку. Разница между мной и Вами состоит в том, что я осознаю, что когда я говорю о некотором объекте я всегда (как и все остальные люди) говорю о плодах человеческой интерпретации реальных объектов, Вы же считаете, что всегда имеете дело с самими объектами.
Всех авторов, которых Вы там упоминаете я читал. У них есть интересные наблюдения, но общую концепцию оцениваю невысоко.
Прощайте, г-н Родин, желаю Вам всего наилучшего.
 

 Александр, то что Вы пишите мне очень понятно, Ваше определение модели (и эйдоса) очень точно; я не знаю, зачем вы приводили Неймана, хотя я с удовольствием прочел. Потом, мне непонятно, зачем нужно приводить определения, не решая каких-то задач. Я задач не ставлю, и под их решение определений не даю.
Мне нужен вопрос; он у меня есть; как кажется, я довольно ясно и неединожды его выразил...я не обсуждаю разниццу терминологий, не описываю роль экспериментатора в эксперименте, не пишу о значимых для того или иного исследования характеристик объекта, "создающих" его модель...это все довольно интересно, но, также - в своей абсолютной беспроблемности - предельно понятно.
Нужна проблема.
Мы с Вами какими-то разными языками говорим.
Вот, например, я в прошлой заметке написал пару строк про зоосемиотику, где выразил свое недоумение относительно того, как ЧТО существуют знаки у животных.
Это такой вопрос.
Потом проблема невозможности формализации языка, я же ее очертил; что здесь было неуслышано?
Простите мой тон.
 

 "The new grammarians funeral: A critigue of Noam Chomskys linguistics"
Ну и название для научной статьи 8)
 

 ну вроде от праздников более-менее отошел. 8)

Александр kaval Каваленков
основные трудности машинного перевода с использованием мета-языка, состоят именно в невозможности создания этого самого языка. невозможно создать такое явление, как универсальный словарь. перевод вообще как процесс, который у обыкновенного переводчика выражается в тезисе "перевожу смысл" и кажется ему до предела элементарным, представляется очень сложным в формальном моделировании.
возмем тот же ваш пример про деньги: можно, конечно, поставить при составлении документа как эмоциальность, но опять же программно смоделировать правильный перенос смысла во все языки вряд ли получится, т.к. в разных языках этот смысл по разному будет выражаться, где то "верни деньги", где то "погаси долг", где то "перестань быть мне должным" и т.д. даже если двигаться в направлении представления, предложенным вами способом, (
) придется разработать для каждого языка реализацию этой схемы в конкрентный правильный и понятный текст, языков много - делать это придется долго. но более того, в языке возможна куча подобных предложений, где требуется именно "извлечь смысл" и вставить средствами другого языка (англичане говорят "I have", мы говорим "у меня есть". это бесконечное занятие. пока мы с вами будем такие трансформации разрабатывать, статистические переводчики или нейронные (а такие уже на подходе) обскочут нас в два счета, и наше дело останется невостребованным.
поэтому то я предложил вам немного модифицированную идею перевода на ограниченное число языков из-за большого количества и разнообразия языков вообще, метод трансфер из-за сложности моделирования смысла предложения.
но сама ваша идея создания мультиязыковых документов, безусловно, очень интересная.
 

 приведу небольшую цитату из книги Briscoe E.J. - Modelling Human Speech Comprehension:
"Interlinguas are rather metaphysical things. Implicitly or explicitly,
they say what the universe is made of (events, processes, individuals, relations, etc.) and how it is put together."
"системы, работающие на технологии интерлингва, скорее относятся к разряду метафизических явлений. явно или неявно, но подразумевается, что они должны включать себя описание множества элементов вселенной (события, процессы, предметы, отношения и т.д.) и то как они соотносятся друг с другом."
перевод авторский 8)
 

1 2