Постановка проблемы. Как известно, алфавиты естественных языков – основа упорядочения слов в справочниках и средство поиска описания объекта по его названию. В отраслях знания, в которых обычны ситуации, когда имеется объект – предмет изучения и известны его свойства, но неизвестно его название, ситуация противоположна – требуется искать объект по набору его свойств. Для этого существуют Определители – растений, птиц, грибов, минералов и др. Поскольку биологические виды относительно хорошо различаются (дискретны), любители природы, в общем, справляются с этой задачей. В случаях же, когда имеют дело с собраниями, сообществами тех же видов, атомов, слов, минералов, лекарств ситуация осложняется непрерывностью изменений соотношений между количествами составных частей таких сообществ. В геологии эта проблема из-за непрерывности в вариациях горных пород и многих минералов господствует,– определение горной породы, как показывали специальные исследования, часто бывает далеко от однозначности даже при наличии сведений о составе и высокой квалификации исследователей. Для решения этой задачи был предложен универсальный – для работы с любыми составами, – язык-метод RHAT (ранговая формула, энтропия, анэнтропия, толерантность), и потребовалось обратиться к лингвистике, в частности, к алфавитам и поработать над созданием их новых типов .
Алфавиты и их свойства. Алфавитами называют стандартные наборы знаков, варьирующих по форме, но не теряющих своей определённости и различимости, которые используются для составления буквенных и цифровых текстов в разных национальных языках и в областях знания.
Существуют алфавиты, в которых места для отдельных знаков не зафиксированы (языки программирования), и есть такие, в которых жёстко закреплены. К последним относятся алфавиты национальных языков, натуральный ряд чисел, числовые последовательности, порождаемые функциями.
Периодическая система химических элементов (ПСЭ), последовательности длин волн (или частот) в шкале электромагнитных колебаний (радуга), размеры отверстий в гранулометрических ситах; шкалы: высот рельефа на топографических картах, температур и многие другие, являясь жёстко упорядоченными последовательностями, могут использоваться как алфавиты второго типа.
Именно их можно использовать для формирования слов, полуколичественно характеризующих состав объекта и их упорядочения по лингвистическому принципу. слова типа введённых автором ранговых формул, – ранжированных по значимости-количеству-роли названий, или аббревиатур, составных частей объекта [1]. В результате каждое такое «слово» (далее без кавычек) занимает определённое место, и есть возможность вставлять новые на строго определённые места, и тогда одинаковые слова располагаются рядом, а близко оказываются слова с с одинаковыми последовательностями знаков со снижающимися весами . В итоге имеем последовательность слов как иерархическую систему компонентных составов.
Алфавиты различаются по степени насыщенности знаков смыслом и силами связи между соседними знаками-смыслами. Алфавиты, у которых знаки несут смысловую нагрузку и связь проявлена чётко, называются интенсиональными [3], у которых же свойства противоположны – неинтенсиональными. Бессмысленное не связывается, как в алфавитах, так и в речи. На первые два места по степени интенсиональности можно поставить алфавит вещественных чисел как связанный со всем измеримым в мире и Периодическую Систему Элементов с её количественными связями свойств соседних атомов и физических свойств «простых» – идеально чистых веществ. Среди слабоинтенсиональных будут находиться алфавиты «естественных» языков в виду неопределённости смыслов и слабой связи между буквами – знаками звуков речи.
Бессодержательность букв и большинства их «естественных» сочетаний можно проиллюстрировать тем, что две-три, а порой и четыре первые буквы, которыми начинаются слова, не имеют общего смысла. Так, за началом слова «кра» могут следовать: -б, -ги, -жа, -ля, -мола, -н, -п, -ска, -снота, -сота, -сотка, -тер, -чка. В любом орфографическом словаре или энциклопедии можно найти много подобных примеров. Смысл появляется только в полных словах, как и при достаточно полной и намеренно не искажённой информации. Более того, смысл слов в тексте очень сильно зависит от знаний и интеллекта читателя, порядка слов в предложении, знаков препинания, от общего смысла всех предложений в тексте, а в речи — от обстановки, интонаций, позы, мимики и цели говорящего. Говоря коротко, естественный язык слишком свободная, размытая система для краткого и точного описания объектов, что бывает необходимо, особенно при создании каталогов и для диаграммного представления и обзора разнообразия большим массивов даннsх и эволюции составов.
Алфавиты для учёта свойств объектов. Каковы же свойства объектов, по которым их различают ?
В разных целях, окружениях и состояниях наблюдателя у объектов изучения могут быть важны свойства разные в своей однотипности (размеры, атомы, цвета, формы…). Для начала остановимся на самом общем свойстве – субстрате или субстанции, как совокупности качественно различающихся частей целого или совокупности результатов его дискретно-шкального разбиения на части.
Центр внимания. Всё, до чего добралась наука, из чего-то состоит. Всё составлено из чего-то различающегося по своим свойствам. Во всём выделяются его однородные части – компоненты, кроме уже совершенно субмикроскопического, у чего части ещё не обнаружены (например, у электрона). Из всех особенностей материальных объектов наиболее специфичными, различающими свойствами, являются их состав как перечень однотипных частей с указанием их долей и структура как расположение частей в целом. Из этих двух первым условием существования-несуществования объекта являются конкретные компоненты и величины их долей в составе объекта. Так, если, в простом случае, – составе объекта заметно меньше 33% атомов кремния, этот объект не принадлежит к группе кварца с его полиморфными разновидностями, различающимися по структуре. В более сложном случае, – если в горной породе кремнезёма (SiO2) меньше 67 массовых процентов, её не называют гранитом. Но, в общем, этого очень мало. При одном и том же содержании, пусть того же кремнезёма, порода может содержать и не содержать полезного компонента. Это хорошо видно при просматривании уникального по целому ряду свойств каталога пород ряда диорит-гранит [2], упорядоченном по алфавиту вещественных чисел, точнее, по содержаниям масс% SiO2. То есть, при всей важности первого компонента, нужно учитывать не один, а по возможности, наибольшее количество компонентов, слагающих объект. И учитывать лучше не в любом порядке.
С учётом всего сказанного, названия или аббревиатуры этих частей – компонентов, при разработке языка RHAT, и были приняты за буквы слов, расположенных по снижению их содержаний в объекте, которые были уже упомянуты как ранговые формулы – (R). То есть это рейтинги компонентов, ставшие буквенными, но уже содержательными – качественно-количественными началами рангово-энтропийного кода составов объектов любой природы.
Именно осознание этого послужило импульсом для создания информационного языка и способа сжатого описания составов, то есть кодирования, при этом такого, чтобы коды можно было упорядочивать по алфавитам как слова. В связи с этим к «буквам» этих «слов» — названиям компонентов возникли особые требования, а именно: 1) свойства должны чётко различаться, то есть должны быть дискретными или дискретизируемыми (шкальными) , 2) интенсивности свойств должны быть измеримы, и 3) интенсивности должны быть выражены в одинаковых единицах.
Свойства знаков новых алфавитов. Знаки, обозначающие свойства, должны отвечать особым требованиям.
1) В отличие от национальных языков, где знак алфавита – буква, как правило, содержит один элемент (исключения Й,Ё.Ы), знаки алфавита компонентного языка RHA могут содержать произвольное количество элементов. 2) Знак компонентного алфавита, в отличие от буквы естественного языка, должен иметь смысл и быть понятен, желательно, не только профессионалам. 3) В сложном знаке (словах, аббревиатурах) первый элемент знака должен выделяться прописной (заглавной — OSiAlK) буквой, чтобы при записи последовательности знаков без пробелов обеспечивались их самостоятельность и различение, уплотнение текста и облегчение обозримости формулы. Отсутствие пробелов между знаками возможно в группах, содержащих 4- 6 знаков, учитывая соображения удобства восприятия целой ранговой формулы.
Добавить:
Порождение алфавитов и их иерархии по степеням охвата действительности. Такие иерархии известны в геологии. Приведём упрощённый пример — атом — минерал- горная порода-геологическое тело как комплекс горных пород…
Существует два типа алфавитов по степени их определённости — с постоянным составом компонента (ионы, молекулы) и составами варьирующим (минералы, горные породы и т.п.)
В начале нижеприведённой таблицы показаны два общеизвестных естественных алфавита и далее несколько искусственных – конлангов (сконструированных языков — language). Всё это «компонентные» или «предметные» алфавиты, применяемые для систематизации составов объектов. и, тем самым, облегчения работы с ними.
Итак:
A B C D E F G H I J … – традиционный алфавит английского языка (слабоинтенсиональный).
А Б В Г Д Е Ё Ж З … – традиционный алфавит русского языка (слабоинтенсиональный)
H He Li Be B C N O F… – алфавит конланга химических элементов – Периодическая Система Элементов (интенсиональный). Эта система была использована как алфавит для упорядочения ранговых формул теоретических составов минералов при создании первого в мире словаря, по которому можно находить минерал по его химическому составу [3]. До этого тот же приём был использован для систематизации составов скаполита [4].
ННе HLi HBe HB … HeH HeBe HeB… PuH PuHe PuBe – фрагменты алфавита конланга химических двухкомпонентных составов (соединений и смесей) – алфавитного словника двухбуквенных интенсиональных слов – иерархической Системы 2-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность химического универсума (как всего мыслимого множества) двухкомпонентных составов составляет 8010 вариантов. Длина такого алфавита на 2010 год [] составляла 320 знакосочетаний.
HHeLi HHeBe HHeB … HeHLi HeHBe HeHB… PuNpU – фрагменты интенсионального алфавита конланга химических трёхкомпонентных составов (соединений и смесей) ) – иерархической Системы 3-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность универсума трёхкомпонентных составов составляет 704 880. Как видим, увеличение детальности рассмотрения на единицу увеличивает разнообразие в 88 раз. (Как просто одной причиной объяснить явление! И как это может быть от понимания сути далеко … .)
K L M N O P Q — алфавит конланга энергетических уровней электронов в атомах 118 первых элементов Периодической системы элементов, интенсиональный.
...Serp…Chlr…Verm…Kaol…Anlc…Ntrl…Dolm… – фрагментированный алфавит (здесь пропущены минералы, редко встречающиеся в изверженных породах) конланга минеральных составов горных пород, использованный при создании R-каталога минеральных составов горных пород [5]. Алфавит «минералогического языка» соответствует перечню ранговых формул в упомянутой выше книге «R-словаре химических составов минералов». Этот интенсиональный алфавит предлагается как алфавит для создания Системы Минеральных Составов Горных Пород (СМС ГП) – определителя горных пород по минеральному составу. За ним может быть сделан следующий шаг по построению иерархии сложности геологических образований: созданию каталога геологических структур: вулканов, месторождений, пачек осадочных пород и других геологических объектов для систематизации и поиска аналогов по их «горнопородному составу». Словник для организации горно-породного алфавита, к сожалению, ограниченный изверженными породами, существует в публикации [6]. Порядок компонентов (горных пород) будет соответствовать порядку в СМС ГП.
XNa+ XK+ XCa+ X(G)… VO2- W(OH)— WF—S. V. … – слабоинтенсиональный двухпараметрический алфавит конланга описания кристаллохимической структуры минерала – турмалина [7]. Первый символ – позиция в кристаллической ячейке, второй – ион со своим содержанием в данной позиции. На данном этапе развития идеи каждый тип структуры должен иметь свой алфавит. Упорядочение самих структурных типов может быть произведено по ранговым формулами составов типового минерала с использованием химического алфавита — Периодической системы Менделеева. Аналогичные алфавиты возможны для кодирования статистик связи заболеваний с местами проживания, профессий с коррупцией, национальности с преступностью и т.п.
0 1 2 3 4 5 6 7 8 9 19 11 … алфавит конланга — натурального ряда чисел в десятичной системе счисления, интенсиональный.
5 10 15 20 25 30 35... – алфавит конланга возрастных распределений населения стран мира [8], алфавит интенсиональный. В демографической литературе, частности в [9, 10], при детальном представлении распределений нередко используется алфавит в виде: 0-4 5-9 10-15 и т.д. . Нелепость закрепившейся и сохраняющейся традиции таких заголовков колонок (вплоть до издания «Россия в цифрах 2919») очевидна — дети в возрастах 4-5, 9-10 14-15 … не отсутствуют и не исключены из учёта. Как видно, много лет авторы боятся, что люди растеряются при учёте, если в день переписи человеку будет точно 20 лет. -он попадёт на границу и достоверность учёта обрушится.
SS BS CS OS – алфавит конланга, созданный для описания шрифтов типа ROMAN [11], неинтенсиональный. Индекс s фиксирует то, что элементы каркаса буквы характеризуются их площадями. Этот алфавит имеет качественную особенность, отличающую его от всех остальных. Здесь символы S,B,C обозначают доли площадей реально измеряемых характеристик знака- буквы «Н» стандартизованной высоты, — соответственно, суммы площадей штамбов, площади перекладины, свободного пространства внутри буквы. При этом остаётся свобода в общей площади буквы, так как при зафиксированной высоте ширина буквы может быть любой. Площадь буквы в окружающем пространстве ничем не ограничена, -не определена и потому несравнима со всеми другими буквами.
Выход из этой ситуации принципиально важен. Буква — не единственное, что пытаются изучать и изучают, не замечая этого, — изолированно от всего окружающего. Вещь — любая — вне среды, вне окружающего пространства, вне времени её существования — бессмысленна — вырвана из множества всего ей окружающего — похожего и непохожего. Она существует вне связей со всем вмещающим её и потому неконтролируема, неизмерима, несравнима, неупорядочиваема, неузнаваема, неуправляема, не познана основательно, полно ,…
Поскольку у стандартизированной по высоте буквы есть неопределённая ширина, дадим ей пространство, в котором она может существовать — жить, — расширяясь, сужаясь, но находясь под контролем. Имея ввиду, что неизвестно, какая ширина буквы может оказаться у дизайнера максимальной, произвольно зададим её сами, сверх всех до сих пор встреченных, но не слишком сильно отличающейся от имеющийся. Так возникло фонтОкно с высотой, равной 1 и шириной 2,168. Разность между общей площадью фонтОкна и площадью, занимаемой буквой, определяет площадь свободного пространства Os. И тогда, рассчитывая доли площади фонтОкна, включающего букву, получаем достаточно определённый комплекс из четырёх параметров SBCO. Возникающая трудность отказаться от привычки видеть отдельные буквы и рассматривать их вне всех прочих, преодолевается сознанием безвыходности положения и возникновением привычки повторять разумное действие.
Ситуация точно та же, что и в геохимических анализах, когда определяют лишь малые — микрокомпоненты — очень важные для многих целей, но игнорируют все основные. Расчёты интегральных характеристик таких анализов заведомо неконтролируемо искажены так же как и в случае шрифтов и во всех других случаях, когда пытаются сравнивать животных по их хвостам. Это только полушутка — в ранжированных математических распределениях удалённую от начала часть обычно и называют хвостом.
K, L, M, N, O, P, Q – Алфавит энергетических уровней электронов атомов
s, p, d, f, g, h, i – Алфавит энергетических подуровней оболочек
Белки, углеводы, жиры, вода, клетчатка – «Черновой» вариант алфавита продуктов питания. Желательно ввести сокращённые обозначения и добавить в алфавит малые компоненты, значимые для свойств продукта компоненты
Примеры компонентных алфавитов.
Нотный музыкальный ряд
Шкала электромагнитных колебаний
В следующей таблице показан пример табличного представления набора ранговых формул разнообразных веществ (пробелы обусловлены размещением символов в ячейках программы Excel и стремлением не перегружать восприятие при отсутствии навыка у читателя)
Этому способу представления составов в 2021 году исполняется 50 лет [13], когда он был продемонстрирован на примере составов изверженных горных пород, в 2003 [4] была опубликована REnAn-колекция, состоявшая из 198 химических составов скаполита В 2010 был издан R-словарь-каталог составов минералов [3], впервые позволивший алфавитно упорядочить минералы НЕ по их названиям, а по преобладанию в них химических элементов. В 2012 в свет вышли две статьи (на русском и английском языках) [7] о первом варианте использования метода для кодирования структур минералов, упорядочение информации минералов с разными структурными типами возможно с использованием имеющегося R-словаря [3]. В 2014 году способ был применён для систематизации возрастных составов населения мира [8-10]. В 2015 и 2019-х годах вышли статьи о систематизации шрифтов [11,12].
Благодарности. Автор безмерно благодарен Наталии Ивановне Красновой, активно воспринявшей идейную основу нового информационного языка и положившей десятки лет жизни на работу по созданию химических каталогов минералов и горных пород и руководство курсовым и дипломными работами студентов вплоть до неизлечимой болезни, её постигшей. Сергею Викторовичу Чебанову автор обязан осознанием интенсиональности алфавитов и общему повышению уровня своего филологического образования.
Литература
Обновляется
Статьи в развитие темы: