Компонентные алфавиты составов по методу RHAT

Постановка проблемы. Как известно, алфавиты естественных языков – основа упорядочения слов в справочниках и средство поиска описания объекта по его названию. В отраслях знания, в которых обычны ситуации, когда имеется объект – предмет изучения и известны его свойства, но неизвестно его название, ситуация противоположна – требуется искать объект по набору его свойств. Для этого существуют Определители – растений, птиц, грибов, минералов и др. Поскольку биологические виды относительно хорошо различаются (дискретны), любители природы, в общем, справляются с этой задачей. В случаях же, когда имеют дело с собраниями,   сообществами тех же видов, атомов, слов, минералов, лекарств ситуация осложняется непрерывностью изменений соотношений между количествами составных частей таких сообществ. В геологии эта проблема из-за непрерывности в вариациях горных пород и многих минералов господствует,– определение горной породы, как показывали специальные исследования, часто бывает  далеко от однозначности даже при наличии сведений о составе и высокой квалификации исследователей. Для решения этой задачи  был предложен  универсальный – для работы с любыми составами, – язык-метод RHAT (ранговая формула, энтропия, анэнтропия, толерантность), и потребовалось обратиться к лингвистике, в частности, к алфавитам и поработать над созданием их новых типов .

Алфавиты и их свойства. Алфавитами называют стандартные наборы знаков, варьирующих по форме, но не теряющих своей определённости и различимости, которые используются для составления буквенных и цифровых текстов в разных национальных языках  и в областях знания.

Существуют алфавиты, в которых места для отдельных знаков не зафиксированы (языки программирования), и есть такие, в которых жёстко закреплены. К последним  относятся  алфавиты национальных языков, натуральный ряд чисел,  числовые последовательности, порождаемые  функциями.

Периодическая система химических элементов (ПСЭ), последовательности длин волн (или частот) в шкале электромагнитных колебаний (радуга), размеры отверстий в гранулометрических ситах; шкалы: высот рельефа на топографических картах, температур и многие другие, являясь жёстко упорядоченными последовательностями, могут использоваться как алфавиты второго типа.

Именно их можно использовать для формирования слов, полуколичественно характеризующих состав объекта  и их  упорядочения по лингвистическому принципу. слова типа введённых автором ранговых формул, – ранжированных по значимости-количеству-роли  названий, или  аббревиатур, составных частей объекта [1].  В результате каждое такое «слово» (далее без кавычек) занимает определённое место, и есть возможность вставлять новые на строго определённые места, и тогда одинаковые слова располагаются  рядом, а близко оказываются слова с с одинаковыми последовательностями знаков со снижающимися весами . В итоге имеем последовательность слов как иерархическую систему компонентных составов.

Алфавиты различаются по степени насыщенности знаков смыслом и силами связи между соседними знаками-смыслами. Алфавиты, у которых знаки несут смысловую нагрузку и связь проявлена чётко, называются интенсиональными [3], у которых же свойства противоположны – неинтенсиональными. Бессмысленное не связывается, как в алфавитах, так и в речи. На первые два места по степени интенсиональности можно поставить алфавит вещественных чисел как связанный со всем измеримым в мире и Периодическую Систему Элементов с её количественными связями свойств соседних атомов и физических свойств «простых» – идеально чистых веществ. Среди слабоинтенсиональных будут находиться алфавиты «естественных» языков в виду неопределённости смыслов и слабой связи между буквами – знаками звуков речи.

Бессодержательность букв и большинства их «естественных» сочетаний можно проиллюстрировать тем, что две-три, а порой и четыре первые буквы, которыми начинаются слова, не имеют общего смысла. Так, за началом слова «кра» могут следовать: -б, -ги, -жа, -ля, -мола, -н, -п, -ска, -снота, -сота, -сотка, -тер, -чка.  В любом орфографическом словаре или энциклопедии можно найти много подобных примеров. Смысл появляется только в полных словах, как и при достаточно полной и намеренно не искажённой  информации. Более того, смысл слов в тексте очень сильно зависит от знаний и интеллекта  читателя, порядка слов в предложении, знаков препинания, от общего смысла всех предложений в тексте, а в речи — от обстановки, интонаций, цели говорящего. Говоря коротко, естественный язык слишком свободная, размытая система для краткого и точного описания объектов, что бывает необходимо, особенно при создании каталогов и для диаграммного представления  и обзора разнообразия большим массивов даннsх и эволюции составов.

Алфавиты для учёта свойств объектов. Каковы же свойства объектов, по которым их различают ?

В разных целях, окружениях и состояниях наблюдателя у объектов изучения могут быть важны свойства разные в своей однотипности (размеры, атомы, цвета, формы…). Для начала остановимся на самом общем свойстве – субстрате  или субстанции, как совокупности качественно различающихся  частей целого или совокупности результатов его дискретно-шкального разбиения на части.

Центр внимания. Всё, до чего добралась наука, из чего-то состоит. Всё составлено из чего-то различающегося по своим свойствам. Во всём выделяются его однородные части – компоненты, кроме уже совершенно субмикроскопического, у чего части ещё не обнаружены (например, у электрона). Из всех особенностей материальных объектов наиболее специфичными, различающими свойствами, являются их состав как перечень однотипных частей с указанием их долей и структура как расположение частей в целом. Из этих двух первым условием существования-несуществования объекта являются конкретные компоненты и величины их долей в составе объекта. Так, если, в простом случае, – составе объекта заметно меньше 33% атомов кремния, этот объект не  принадлежит к группе кварца с его полиморфными разновидностями, различающимися по структуре. В более сложном случае, – если в горной породе кремнезёма (SiO2) меньше 67 массовых процентов, её не называют гранитом. Но, в общем, этого очень мало. При одном и том же содержании, пусть того же кремнезёма, порода может содержать и не содержать полезного компонента. Это хорошо видно при просматривании уникального по целому ряду свойств каталога пород ряда диорит-гранит [2], упорядоченном по алфавиту вещественных чисел, точнее, по содержаниям масс% SiO2. То есть, при всей важности первого компонента,  нужно учитывать не один, а по возможности, наибольшее количество  компонентов, слагающих объект. И учитывать лучше не в любом порядке.

С учётом всего сказанного, названия или аббревиатуры этих частей – компонентов, при разработке языка RHAT,  и были приняты за буквы слов, расположенных по снижению их содержаний в объекте, которые были уже упомянуты как  ранговые формулы – (R). То есть  это рейтинги компонентов, ставшие буквенными, но уже содержательными – качественно-количественными началами рангово-энтропийного кода составов объектов любой природы.

Именно осознание этого послужило импульсом для создания информационного языка и способа сжатого описания составов, то есть кодирования, при этом такого, чтобы коды можно было упорядочивать по алфавитам как слова. В связи с этим к «буквам» этих «слов» — названиям компонентов возникли особые требования, а именно: 1) свойства должны чётко различаться, то есть должны быть дискретными или дискретизируемыми (шкальными) , 2) интенсивности свойств должны быть измеримы, и 3) интенсивности должны быть выражены в одинаковых единицах.

Свойства знаков новых алфавитов. Знаки, обозначающие свойства, должны отвечать особым требованиям.

1) В отличие от национальных языков, где знак алфавита – буква, как правило, содержит один элемент (исключения Й,Ё.Ы), знаки алфавита компонентного языка RHA могут содержать произвольное количество элементов. 2) Знак компонентного алфавита, в отличие от буквы естественного языка, должен иметь смысл и быть понятен, желательно, не только профессионалам. 3) В сложном знаке (словах, аббревиатурах) первый элемент знака должен выделяться прописной (заглавной — OSiAlK) буквой, чтобы при записи последовательности знаков без пробелов обеспечивались их самостоятельность и различение, уплотнение текста и облегчение обозримости формулы. Отсутствие пробелов между знаками возможно в группах, содержащих  4- 6 знаков, учитывая  соображения удобства восприятия целой ранговой формулы.

Добавить:

Порождение алфавитов и их иерархии по степеням охвата действительности (?)

Существует два типа алфавитов по степени их определённости — с постоянным составом компонента (молекулы) и составом варьирующим (минералы, горные породы и т.п.)

В начале нижеприведённой таблицы показаны два общеизвестных естественных алфавита и далее несколько искусственных – конлангов (сконструированных языков — language). Всё это «компонентные» или «профессионально-компонентные» алфавиты,  применяемые для систематизации составов объектов. и, тем самым, облегчения работы с ними.

Итак:

Алфавиты

A B C D E F G H I J … – традиционный алфавит английского языка (слабоинтенсиональный).

А Б В Г Д Е Ё Ж З … – традиционный алфавит русского языка (слабоинтенсиональный)

H He Li Be B C N O F… – алфавит конланга химических элементов – Периодическая Система Элементов (интенсиональный). Эта система была использована как алфавит для упорядочения ранговых формул теоретических составов минералов при создании первого в мире словаря, по которому можно находить минерал по его химическому составу [3]. До этого тот же приём был использован для систематизации составов скаполита [4].

ННе HLi HBe HB … HeH HeBe HeB… PuH PuHe PuBe – фрагменты алфавита конланга химических двухкомпонентных составов (соединений и смесей) – алфавитного словника двухбуквенных интенсиональных слов – иерархической Системы 2-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность химического универсума (как всего мыслимого множества) двухкомпонентных составов составляет 8010 вариантов. Длина такого алфавита на 2010 год  []  составляла 320 знакосочетаний.

HHeLi HHeBe HHeB … HeHLi HeHBe HeHB… PuNpU – фрагменты интенсионального алфавита конланга химических трёхкомпонентных составов (соединений и смесей) ) – иерархической Системы 3-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность универсума трёхкомпонентных составов составляет 704 880. Как видим, увеличение детальности рассмотрения на единицу увеличивает разнообразие в 88 раз. (Как просто одной причиной объяснить явление! И как это может быть от понимания сути далеко …  .)

K L M N O P Q — алфавит  конланга энергетических уровней электронов в атомах 118 первых элементов Периодической системы элементов, интенсиональный.

...Serp…Chlr…Verm…Kaol…Anlc…Ntrl…Dolm… – фрагментированный алфавит (здесь пропущены минералы, редко встречающиеся в изверженных породах)  конланга минеральных составов горных пород, использованный при создании R-каталога минеральных составов горных пород [5]. Алфавит «минералогического языка» соответствует перечню ранговых формул в упомянутой выше книге «R-словаре химических составов минералов». Этот интенсиональный алфавит предлагается как алфавит для создания Системы Минеральных Составов Горных Пород (СМС ГП) – определителя горных пород по минеральному составу. За ним может быть сделан следующий шаг по построению иерархии сложности геологических образований: созданию каталога геологических структур: вулканов, месторождений, пачек осадочных пород и других геологических объектов для систематизации и поиска аналогов по их «горнопородному составу». Словник для организации горно-породного алфавита, к сожалению, ограниченный изверженными породами, существует в публикации [6]. Порядок компонентов (горных пород) будет соответствовать порядку в СМС ГП.

XNa+ XK+ XCa+ X(G)… VO2-  W(OH) WFS. V. … – слабоинтенсиональный двухпараметрический алфавит конланга описания кристаллохимической структуры минерала турмалина [7]. Первый символ – позиция в кристаллической ячейке, второй – ион со своим содержанием в данной позиции. На данном этапе развития идеи каждый тип  структуры должен иметь свой алфавит. Упорядочение самих стрктурных типов может быть  произведено  по ранговым формулами составов типового минерала с использованием химического алфавита — Периодической системы Менделеева.  Аналогичные алфавиты возможны для кодирования статистик связи заболеваний с местами проживания, профессий с коррупцией, национальности с преступностью и т.п.

0  1 2 3 4 5 6 7 8 9 19 11 …   алфавит конланга — натурального ряда чисел в десятичной системе счисления, интенсиональный.

5 10 15 20 25 30 35... – алфавит конланга возрастных распределений населения стран мира [8], алфавит интенсиональный. В демографической литературе, частности в [9, 10], при детальном представлении распределений нередко   используется алфавит в виде: 0-4  5-9  10-15 и т.д. . Нелепость закрепившейся и сохраняющейся традиции таких заголовков колонок (вплоть до издания  «Россия в цифрах 2919»)  очевидна — дети в возрастах 4-5, 9-10 14-15  … не отсутствуют и не исключены из учёта. Как видно, много лет авторы боятся, что люди растеряются при учёте, если в день переписи человеку будет точно 20 лет. -он попадёт на границу и достоверность учёта обрушится.

SS BS CS OS – алфавит конланга, созданный для описания шрифтов типа ROMAN [11], неинтенсиональный. Индекс s фиксирует то, что элементы каркаса буквы характеризуются их площадями. Этот алфавит имеет качественную особенность, отличающую его от всех остальных. Здесь символы S,B,C  обозначают доли площадей реально измеряемых характеристик знака- буквы  «Н» стандартизованной высоты, — соответственно, суммы площадей штамбов, площади перекладины, свободного пространства внутри буквы.  При этом остаётся свобода в общей площади буквы, так как при зафиксированной высоте ширина буквы может быть любой. Площадь буквы в окружающем пространстве ничем не ограничена, -не определена и потому несравнима со всеми другими буквами.

Выход из этой ситуации принципиально важен. Буква — не единственное, что пытаются изучать и изучают, не замечая этого, — изолированно от всего окружающего. Вещь — любая — вне среды, вне окружающего пространства, вне времени её существования —  бессмысленна — вырвана из множества  всего ей окружающего — похожего и непохожего.  Она существует вне связей со всем вмещающим её и потому неконтролируема,  неизмерима, несравнима,  неупорядочиваема, неузнаваема, неуправляема, не познана основательно, полно ,…

Поскольку у стандартизированной по высоте буквы есть неопределённая ширина, дадим ей пространство, в котором она может существовать — жить, — расширяясь, сужаясь, но находясь под контролем.  Имея ввиду, что неизвестно, какая ширина буквы может оказаться у дизайнера максимальной, произвольно зададим её сами, сверх всех до сих пор встреченных, но не слишком сильно отличающейся от имеющийся. Так возникло фонтОкно с высотой, равной 1 и шириной  2,168. Разность между общей площадью фонтокна и площадью, занимаемой буквой,  определяет площадь свободного пространства  Os. И тогда, рассчитывая доли площади фонтОкна, включающего букву, получаем достаточно определённый комплекс из четырёх параметров  SBCO.  Возникающая трудность отказаться от привычки видеть отдельные буквы и рассматривать их вне всех прочих, преодолевается сознанием безвыходности положения и возникновением привычки повторять разумное действие.

Ситуация точно та же, что и в геохимических анализах, когда определяют лишь малые — микрокомпоненты — очень важные для многих целей, но игнорируют все основные. Расчёты интегральных характеристик таких анализов заведомо неконтролируемо искажены так же как и в случае шрифтов и во всех других случаях, когда пытаются сравнивать животных по их  хвостам. Это только полушутка — в ранжированных математических распределениях удалённую от начала часть обычно и называют хвостом.

Белки углеводы жиры вода клетчатка Продукты питания

Примеры компонентных алфавитов.

Нотный музыкальный ряд 

Шкала электромагнитных колебаний

В следующей таблице показан пример табличного представления набора  ранговых формул разнообразных веществ (пробелы обусловлены размещением символов в ячейках программы Excel.

Этому способу представления составов в 2021 году исполняется 50 лет [13], когда он был продемонстрирован на примере составов изверженных горных пород,  в 2003 [4] была  опубликована REnAn-колекция, состоявшая из 198  химических составов  скаполита  В 2010 был издан R-словарь-каталог составов минералов [3], впервые позволивший алфавитно упорядочить минералы НЕ по их названиям, а по преобладанию в них химических элементов. В  2012 в свет вышли две статьи (на русском и английском языках) [7] о первом варианте использования метода для кодирования структур минералов, упорядочение информации минералов с разными структурными типами возможно с использованием имеющегося R-словаря [3]. В 2014 году способ был применён для систематизации возрастных составов населения мира [8-10]. В 2015 и 2019-х годах вышли статьи о систематизации шрифтов [11,12].

Литература

Обновляется

 Статьи в развитие темы:

Ранговая формула

Возрожденный треугольник

Ранговые формулы по химическому алфавиту

Энтропия

A-Анэнтропия по Петрову  

Т-Толерантность по Петрову

Вклады в Е А Т

 Диаграмма смешения разделения

Теоретические траектории смешения

RHA-Каталог шрифтов типа Roman

Каркасы буквы «Н» класса OSCB на диаграмме НА

Вернуться на “Картинки И”

На главную

Блог Томаса Георгиевича Петрова