Компонентные алфавиты составов по методу RHAT

Постановка проблемы. Как известно, алфавиты естественных языков – основа упорядочения слов в словарях и средство поиска описания объекта по его названию. В отраслях знания, в которых обычны ситуации, когда имеется объект – предмет изучения и известны его свойства, но неизвестно его название, ситуация противоположна – требуется искать объект по набору его свойств. Для этого существуют Определители – растений, птиц, грибов, минералов и др. Поскольку биологические виды относительно хорошо различаются (дискретны), любители природы, в общем, справляются с этой задачей. В случаях же, когда имеют дело с собраниями,   сообществами тех же видов, атомов, слов, минералов, ситуация осложняется непрерывностью изменений соотношений между количествами составных частей. В геологии эта проблема из-за непрерывности в вариациях горных пород и многих минералов господствует,– определение горной породы, даже при наличии сведений о составе и высокой квалификации исследователей, как показывали специальные исследования, часто было далеко от однозначности. Для решения этой задачи и был предложен  универсальный – для работы с любыми составами, – язык-метод RHAT (ранговая формула, энтропия, анэнтропия, толерантность), и потребовалось обратиться к лингвистике, в частности, к алфавитам и поработать над упорядочением создания их новых вариантов.

Алфавиты и их свойства. Алфавитами называют стандартные множества знаков, варьирующих по форме, но не теряющих своей определённости и различимости, которые используются для составления буквенно-цифровых текстов в разных национальных языках  и  в областях знания.

Существуют алфавиты, в которых места для отдельных знаков не зафиксированы (языки программирования), и есть такие, в которых жёстко закреплены. К последним  относятся  национальные языки, вещественные числа, Периодическая система химических элементов (ПСЭ). последовательности длин волн (или частот) в шкале электромагнитных колебаний (радуга), размеры отверстий в гранулометрических ситах; шкалы: высот рельефа на топографических картах, температур и многие другие.

Нас, в первую очередь,  будут интересовать алфавиты второго типа, так как именно такие позволяют использовать их для упорядочения по лингвистическому принципу слов типа введённых автором ранговых формул, – ранжированных по значимости-количеству-роли аббревиатур названий составных частей объекта [1].  В результате каждое такое «слово» (далее без кавычек) занимает определённое место, и есть возможность вставлять новые на строго определённые места, и тогда одинаковые слова располагаются  рядом, а близко оказываются слова с с одинаковыми последовательностями знаков со снижающимися весами . В итоге имеем последовательность слов как иерархическую систему компонентных составов.

Алфавиты различаются по степени насыщенности знаков смыслом и силами связи между соседними знаками-смыслами. Алфавиты, у которых знаки несут смысловую нагрузку и связь проявлена чётко, называются интенсиональными [3], у которых же свойства противоположны – неинтенсиональными. Бессмысленное не связывается, как в алфавитах, так и в речи. На первые два места по степени интенсиональности можно поставить алфавит вещественных чисел как связанный со всем измеримым в мире и Периодическую Систему Элементов с её количественными связями свойств соседних атомов и физических свойств «простых» – идеально чистых веществ. Среди слабоинтенсиональных будут находиться алфавиты «естественных» языков в виду неопределённости смыслов и слабой связи между буквами – знаками звуков речи.

Бессодержательность букв и большинства их «естественных» сочетаний можно проиллюстрировать тем, что две-три, а порой и 4 первые буквы, которыми начинаются слова, не имеют общего смысла. Так, за началом слова «кра» могут следовать: -б, -ги, -жа, -ля, -мола, -н, -п, -ска, -снота, -сота, -сотка, -тер, -чка.  В любом орфографическом словаре или энциклопедии можно найти много подобных примеров. Смысл появляется только в полных словах. Более того, смысл слов в тексте очень сильно зависит от знаний и интеллекта  читателя, порядка слов в предложении, знаков препинания, от общего смысла всех предложений в тексте, а в речи — от обстановки, интонаций, цели говорящего. Говоря коротко, естественный язык слишком свободная, размытая система для краткого и точного описания объектов, что бывает необходимо, особенно при создании каталогов и для для диаграммного представления  и обзора разнообразия большим массивов даннх и эволюции составов.

Алфавиты для учёта свойств объектов. Каковы же свойства объектов, по которым их различают ?

В разных целях, окружениях и состояниях наблюдателя у объектов изучения могут быть важны свойства разные в своей однотипности (размеры, атомы, цвета, формы…). Для начала остановимся на самом общем свойстве – субстрате  или субстанции, как совокупности качественно различающихся  частей целого или совокупности результатов его дискретно-шкального разбиения на части.

Центр внимания. Всё, до чего добралась наука, из чего-то состоит. Всё составлено из чего-то различающегося по своим свойствам. Во всём выделяются его однородные части – компоненты, кроме уже совершенно субмикроскопического, у чего части ещё не обнаружены (например, у электрона). Из всех особенностей материальных объектов наиболее специфичными, различающими свойствами, являются их состав как перечень однотипных частей с указанием их долей и структура как расположение частей в целом. Из этих двух первым условием существования-несуществования объекта являются конкретные компоненты и величины их долей в составе объекта. Так, если, в простом случае, – составе объекта заметно меньше 33% атомов кремния, этот объект не  принадлежит к группе кварца с его полиморфными разновидностями, различающимися по структуре. В более сложном случае, – если в горной породе кремнезёма (SiO2) меньше 67 массовых процентов, её не называют гранитом. Но, в общем, этого очень мало. При одном и том же содержании, пусть того же кремнезёма, порода может содержать и не содержать полезного компонента. Это хорошо видно при просматривании уникального по целому ряду свойств каталога пород ряда диорит-гранит [2], упорядоченном по алфавиту вещественных чисел, точнее, по содержаниям масс% SiO2. То есть, при всей важности первого компонента,  нужно учитывать не один, а по возможности, наибольшее количество  компонентов, слагающих объект. И учитывать лучше не в любом порядке.

С учётом всего сказанного, названия или аббревиатуры этих частей – компонентов, при разработке языка RHAT,  и были приняты за буквы слов, расположенных по снижению их содержаний в объекте, которые были уже упомянуты как  ранговые формулы – (R). То есть  это рейтинги компонентов, ставшие буквенными, но уже содержательными – качественно-количественными началами рангово-энтропийного кода составов объектов любой природы.

Именно осознание этого послужило импульсом для создания информационного языка и способа сжатого описания составов, то есть кодирования, при этом такого, чтобы коды можно было упорядочивать по алфавитам как слова. В связи с этим к «буквам» этих «слов» — названиям компонентов возникли особые требования, а именно: 1) свойства должны чётко различаться, то есть должны быть дискретными или дискретизируемыми (шкальными) , 2) интенсивности свойств должны быть измеримы, и 3) интенсивности должны быть выражены в одинаковых единицах.

Свойства знаков новых алфавитов. Знаки, обозначающие свойства, должны отвечать особым требованиям.

1) В отличие от национальных языков, где знак алфавита – буква, как правило, содержит один элемент (исключения Й,Ё.Ы), знаки алфавита компонентного языка RHA могут содержать произвольное количество элементов. 2) Знак компонентного алфавита, в отличие от буквы естественного языка, должен иметь смысл и быть понятен, желательно, не только профессионалам. 3) В сложном знаке (словах, аббревиатурах) первый элемент знака должен выделяться прописной (заглавной — OSiAlK) буквой, чтобы при записи последовательности знаков без пробелов обеспечивались их самостоятельность и различение, уплотнение текста и облегчение обозримости формулы. Отсутствие пробелов между знаками возможно в группах, содержащих  4- 6 знаков, учитывая  соображения удобства восприятия целой ранговой формулы.

Примеры компонентных алфавитов.

В начале нижеприведённой таблицы показаны два общеизвестных естественных алфавита и далее несколько искусственных – конлангов (сконструированных языков — language). Всё это «компонентные» или «профессионально-компонентные» алфавиты,  применяемые для систематизации составов объектов. и, тем самым, облегчения работы с ними.

Итак:

Алфавиты

A B C D E F G H I J … – традиционный алфавит английского языка (слабоинтенсиональный).

А Б В Г Д Е Ё Ж З … – традиционный алфавит русского языка (слабоинтенсиональный)

H He Li Be B C N O F… – алфавит конланга химических элементов – Периодическая Система Элементов (интенсиональный). Эта система была использована как алфавит для упорядочения ранговых формул теоретических составов минералов при создании первого в мире словаря, по которому можно находить минерал по его химическому составу [3]. До этого тот же приём был использован для систематизации составов скаполита [4].

ННе HLi HBe HB … HeH HeBe HeB… PuH PuHe PuBe – фрагменты алфавита конланга химических двухкомпонентных составов (соединений и смесей) – алфавитного словника двухбуквенных интенсиональных слов – иерархической Системы 2-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность химического универсума (как всего мыслимого множества) двухкомпонентных составов составляет 8010 вариантов. Интересно было бы определить реальное число, достигает ли оно 20?

HHeLi HHeBe HHeB … HeHLi HeHBe HeHB… PuNpU – фрагменты интенсионального алфавита конланга химических трёхкомпонентных составов (соединений и смесей) ) – иерархической Системы 3-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность универсума трёхкомпонентных составов составляет 704 880. Как видим, увеличение детальности рассмотрения на единицу увеличивает разнообразие в 88 раз. (Как просто одной причиной объяснить явление! И как это может быть от понимания сути далеко …  .)

...Serp…Chlr…Verm…Kaol…Anlc…Ntrl…Dolm… – фрагментированный алфавит (здесь пропущены минералы, редко встречающиеся в изверженных породах)  конланга минеральных составов горных пород, использованный при создании R-каталога минеральных составов горных пород [5]. Алфавит «минералогического языка» соответствует перечню ранговых формул в упомянутой выше книге «R-словаре химических составов минералов». Этот интенсиональный алфавит предлагается как алфавит для создания Системы Минеральных Составов Горных Пород (СМС ГП) – определителя горных пород по минеральному составу. За ним может быть сделан следующий шаг по построению иерархии сложности геологических образований: созданию каталога геологических структур: вулканов, месторождений, пачек осадочных пород и других геологических объектов для систематизации и поиска аналогов по их «горнопородному составу». Словник для организации горно-породного алфавита, к сожалению, ограниченный изверженными породами, существует в публикации [6]. Порядок компонентов (горных пород) будет соответствовать порядку в СМС ГП.

XNa+ XK+ XCa+ X(G)… VO2-  W(OH) WFS. V. … – слабоинтенсиональный двухпараметрический алфавит конланга описания кристаллохимической структуры минерала – турмалина [7]. Первый символ – позиция в кристаллической ячейке, второй – ион со своим содержанием в данной позиции. На данном этапе развития идеи каждый тип  структуры должен иметь свой алфавит. Упорядочение самих стрктурных типов может быть  произведено  по ранговым формулами составов типового минерала с использованием химического алфавита — Периодической системы Менделеева.  Аналогичные алфавиты возможны для кодирования статистик связи заболеваний с местами проживания, профессий с коррупцией, национальности с преступностью и т.п.

5 10 15 20 25 30 35... – алфавит конланга возрастных распределений населения стран мира [8], алфавит интенсиональный. В демографической литературе, частности в [9, 10], при детальном представлении распределений нередко   используется алфавит в виде: 0-4  5-9  10-15 и т.д. . Нелепость закрепившейся и сохраняющейся традиции таких заголовков колонок (вплоть до издания  «Россия в цифрах 2919»)  очевидна — дети в возрастах 4-5, 9-10 14-15  … не отсутствуют и не исключены из учёта. Как видно, много лет авторы боятся, что люди растеряются при учёте, если в день переписи человеку будет точно 20 лет. -он попадёт на границу и достоверность учёта обрушится.

SS BS CS OS – алфавит конланга, созданный для описания шрифтов типа ROMAN [11], неинтенсиональный. Индекс s фиксирует то, что элементы каркаса буквы характеризуются их площадями. Этот алфавит имеет качественную особенность, отличающую его от всех остальных. Здесь символы S,B,C  обозначают доли реально измеряемых характеристик знака- буквы  «Н» стандартизованной высоты , — соответственно, суммы площадей штамбов, площади перекладины, свободного пространства внутри буквы.  При этом остаётся свобода в общей площади буквы: при зафиксированной высоте ширина буквы может быть любой. Площадь буквы в окружающем пространстве ничем не ограничена, -не определена и потому несравнима со всеми другими буквами.

Выход из этой ситуации принципиально важен. Буква — не единственное, что пытаются изучать и изучают, не замечая этого, — изолированно от всего окружающего. Вещь — любая — вне среды, вне окружающего пространства, вне времени её существования —  бессмысленна — вырвана из множества  всего ей окружающего — похожего и непохожего.  Она существует вне связей со всем вмещающим её и потому неконтролируема,  неизмерима, несравнима,  неупорядочиваема, неузнаваема, неуправляема, не познана основательно, полно,…

Поскольку у стандартизированной по высоте буквы есть неопределённая ширина, дадим ей пространство, в котором она может существовать — жить, — расширяясь, сужаясь, но находясь под контролем.  Имея ввиду, что неизвестно, какая ширина буквы может оказаться у дизайнера максимальной, произвольно зададим её сами, сверх всех до сих пор встреченных, но не слишком сильно отличающейся от имеющийся. Так возникло фонтОкно с высотой, равной 1 и шириной  2,168, чем определяется и площадью свободного пространства  Os. И тогда, рассчитывая доли площади фонтОкна, включающего букву, получаем достаточно определённое, выделенное из всего бесконечного разнообразия обликов буквы, состояние комплекса из четырёх параметров  SBC и  доли свободного пространства — O.  Возникает трудность отказаться от привычки видеть отдельные буквы, и рассматривать их вне всех прочих. Но, трудность преодолевается сознанием безвыходности положения и возникновением привычки повторять разумное действие.

Ситуация точно та же, что и в геохимических анализах, когда определяют лишь малые — микрокомпоненты — очень важные для многих целей, но игнорируют все основные. Расчёты интегральных характеристик таких анализов заведомо неконтролируемо искажены так же как и в случае шрифтов и во всех других случаях, когда пытаются сравнивать животных по их  хвостам. Это только полушутка — в ранжированных математических распределениях удалённую от начала часть обычно и называют хвостом.

В следующей таблице показан пример табличного представления набора  ранговых формул разнообразных веществ (пробелы обусловлены размещением символов в ячейках программы Excel.

Этому способу представления составов в 2021 году исполняется 50 лет [13], когда он был продемонстрирован на примере составов изверженных горных пород,  в 2003 [4] была  опубликована REnAn-колекция, состоявшая из 198  химических составов  скаполита  В 2010 был издан R-словарь-каталог составов минералов [3], впервые позволивший алфавитно упорядочить минералы НЕ по их названиям, а по преобладанию в них химических элементов. В  2012 в свет вышли две статьи (на русском и английском языках) [7] о первом варианте использования метода для кодирования структур минералов, упорядочение информации минералов с разными структурными типами возможно с использованием имеющегося R-словаря [3]. В 2014 году способ был применён для систематизации возрастных составов населения мира [8-10]. В 2015 и 2019-х годах вышли статьи о систематизации шрифтов [11,12].

Литература

  1. Петров Т.Г. Обоснование варианта общей классификации  геохимических систем. // Вестник ЛГУ.- N18.- 1971. С.30-38.
  2. Чебанов С.В. Петров Т.Г. Интенсиональность, интенсиональные алфавиты, интенсиональные слова и словари// В сб. Актуальные проблемы современной когнитивной науки. Иваново. 2013 С.239-266. DOI: 10.13140/RG.2.1.4542.8644
  3. .The scientific data that led to the opening of mineral wealth of Siberia and Mongolia. Ed. A.B.Vistelius. Athens: Theophrastus Publ.- 1995.
  4. Петров Т.Г., Краснова Н.И. R-словарь-каталог химических составов минералов. СПб, «Наука», 2010, 150 с. Грант РФФИ № 09 — 05 — 07070д
  5. Золотарев А.А., Петров Т.Г., С.В. Мошкин Особенности химического состава минералов группы скаполита//Записки ВМО, 2003. №6. С. 63-84.
  6. Petrov Т. G., Moshkin S.V., Krasnova N.l., Bumaeva M.Ju. RHAT- catalog of modal mineral compositions of igneous rocks. ResearchGate Tomas G.Petrov DOI: 10.13140/RG.2.2.33307.31529
  7. Le Maitre, R. W. (ed.) Igneous Rocks. A Classification and Glossary of Terms. Recommendations of the International Union of Geological Sciences Subcommission on the Systematics of Igneous Rocks, 2nd ed. xvi + 236 pp. Cambridge, New York, Melbourne — 2002.
  8. Петров Т.Г., Н.И. Краснова RHA-кодирование минерального состава кристаллических горных пород и способ их систематизации. Современные проблемы магматизма и метаморфизма. Т.2 СПб 2012. С.120-123
  9. Petrov T. G., Andriyanets-Buyko A. A., Moshkin S.V. A Two-Parameter Alphabet for Coding Structural-Chemical Information and its Systematization (Using the Example of Tourmaline)//Automatic Documentation and Mathematical Linguistics, 2012, Vol. 46, No. 1
  10. Петров Т.Г. Метод RHA для кодирования, систематизации и отображения изменений возрастных составов населения.DOI:10.13140/RG.2.1.3207.2166;   Intellectual Archive: Search Archive-All-All-Tomas G. Petrov-1521; Петров Т.Г. Способ RHA для описания и систематизации составов в применении к некоторым задачам демографии.Research Gate DOI: 10.13140/RG.2.1.3878.7040.
  11. Борисов В.А.  Население мира. М.: Мысль. 1989.- 477 с.
  12. Россия в цифрах. 2008. Краткий статистический сборник. М.: Росстат. 2008. 512 с.
  13. Петров Т.Г., Н.И. Краснова RHA-кодирование минерального состава кристаллических горных пород и способ их систематизации. Современные проблемы магматизма и метаморфизма. Т.2 СПб 2012. С.120-123
  14. Петрова Е.Т., Петров Т.Г.  Кодирование и систематизация шрифтов на базе информационного языка –метода RHA// Вестник СПГУ Технологии и Дизайна. Сер 2. 2015. №1. С. 39-44
  15. Петрова Е.Т., Петров Т.Г, Чебанов С.В., Мошкин С.В. Метод кодирования многокомпонентных объектов (RHA) и его применение для упорядочивания шрифтов прямого начертания//Научно-техническая информация НТИ сер 2, 2019 с.28-44;  Petrova Е. Т., Petrov T.G., Chebanov S.V., Moshkin S.V. Method of Coding for Multicomponent Objects (RHA) and Its Application for Ordering Roman Fonts//Automatic Documentation and Mathematical Linguistics May 2019. 53(3):143-159 DOI: 10.3103/S000510551903008 https://rdcu.be/bPDmC 

 Статьи в развитие темы:

Ранговая формула

Возрожденный треугольник

Ранговые формулы по химическому алфавиту

Энтропия

A-Анэнтропия по Петрову  

Т-Толерантность по Петрову

Вклады в Е А Т

 Диаграмма смешения разделения

Теоретические траектории смешения

RHA-Каталог шрифтов типа Roman

Каркасы буквы «Н» класса OSCB на диаграмме НА

Вернуться на “Картинки И”

На главную

Блог Томаса Георгиевича Петрова