Постановка проблемы. Как известно, алфавиты естественных языков – основа упорядочения слов в словарях и средство поиска описания объекта по его названию. В отраслях знания, в которых обычны ситуации, когда имеется объект – предмет изучения и известны его свойства, но неизвестно его название, ситуация противоположна – требуется искать объект по набору его свойств. Для этого существуют Определители – растений, птиц, грибов, камней, минералов и др. Поскольку биологические виды относительно хорошо различаются (дискретны), любители природы, в общем, справляются с этой задачей. В случаях же, когда имеют дело с ценозами – сообществами тех же видов, атомов, слов, минералов, ситуация осложняется непрерывностью изменений соотношений между количествами составных частей. В геологии эта проблема из-за непрерывности в вариациях горных пород и многих минералов господствует,– определение горной породы, даже при наличии сведений о составе и высокой квалификации исследователей, как показывали специальные исследования, часто было далеко от однозначности.
Для решения этой задачи и был предложен универсальный – для работы с любыми составами, – язык-метод RHAT (ранговая формула, энтропия, анэнтропия, толерантность), и потребовалось обратиться к лингвистике, в частности, к алфавитам и поработать над упорядочением создания их новых вариантов.
Алфавиты и их свойства. Алфавитами называют стандартные множества знаков, варьирующих по форме, но не теряющих своей определённости и различимости, которые используются для составления буквенно-цифровых текстов в разных национальных языках и в областях знания.
Существуют алфавиты, в которых места для отдельных знаков не зафиксированы (языки программирования), и есть такие, в которых жёстко закреплены. К ним относятся национальные языки, вещественные числа, Периодическая система химических элементов (ПСЭ). последовательности длин волн (или частот) в шкале электромагнитных колебаний (радуга), размеры отверстий в гранулометрических ситах; шкалы: высот рельефа на топографических картах, температур, твёрдости (шкала Мооса) и многие другие.
Нас, в первую очередь, будут интересовать алфавиты второго типа, так как именно такие позволяют использовать их для упорядочения слов типа ранговых формул по лингвистическому принципу. (Напомним, – согласно этому принципу любые слова сначала располагаются по порядку расположения их первых букв в алфавите, затем в пределах групп с одинаковыми первыми буквами та же процедура производится с учётом вторых букв и так далее.) В результате каждое слово занимает определённое место, и есть возможность вставлять новые на строго определённые места, и тогда одинаковые слова становятся рядом, а близко оказываются слова с мало различающиеся концами, но с одинаковыми последовательностями в начале, и это весьма значимо для результатов метода.
Алфавиты различаются по степени насыщенности знаков смыслом и силами связи между соседними знаками-смыслами. Алфавиты, у которых знаки несут смысловую нагрузку и связь проявлена чётко, называются интенсиональными [3], у которых же свойства противоположны – неинтенсиональными. Бессмысленное не связывается, как в алфавитах, так и в речи. На первые два места по степени интенсиональности можно поставить алфавит вещественных чисел как связанный со всем измеримым в мире и Периодическую Систему Элементов с её количественными связями свойств соседних атомов и физических свойств «простых» – идеально чистых веществ. Среди слабоинтенсиональных будут находиться алфавиты «естественных» языков в виду неопределённости смыслов и слабой связи между буквами – знаками звуков речи.
Бессодержательность букв и большинства их «естественных» сочетаний можно проиллюстрировать тем, что две-три, а порой и 4 первые буквы, которыми начинаются слова, не имеют общего смысла. Так, за началом слова «кра» могут следовать: -б, -ги, -жа, -ля, -мола, -н, -п, -ска, -снота, -сота, -сотка, -тер, -чка. В любом орфографическом словаре или энциклопедии можно найти много подобных примеров. Смысл появляется только в полных словах. Более того, смысл слов в тексте очень сильно зависит от знаний и интеллекта читателя, порядка слов в предложении, знаков препинания, от общего смысла всех предложений в тексте, а в речи — от обстановки, интонаций, цели говорящего. Говоря коротко, естественный язык слишком свободная, размытая система для краткого и точного описания объектов, что бывает необходимо, особенно при создании каталогов и для для диаграммного представления эволюции составов.
Алфавиты для учёта свойств объектов. Каковы же свойства объектов, по которым их различают ?
В разных целях, окружениях и состояниях наблюдателя у объектов изучения могут быть важны свойства разные в своей однотипности (размеры, атомы, цвета, формы…). Для начала остановимся на самом общем свойстве – субстрате или субстанции, как совокупности качественно различающихся частей целого или совокупности результатов его дискретно-шкального разбиения на части.
Центр внимания. Всё, до чего добралась наука, из чего-то состоит. Всё составлено из чего-то различающегося по своим свойствам. Во всём выделяются его однородные части – компоненты, кроме уже совершенно субмикроскопического, у чего части ещё не обнаружены (например, у электрона). Из всех особенностей материальных объектов наиболее специфичными, различающими свойствами, являются их состав как перечень однотипных частей с указанием их долей и структура как расположение частей в целом. Из этих двух первым условием существования-несуществования объекта являются конкретные компоненты и величины их долей в составе объекта. Так, если, в простом случае, – составе объекта заметно меньше 33% атомов кремния, этот объект не принадлежит к группе кварца с его полиморфными разновидностями, различающимися по структуре. В более сложном случае, – если в горной породе кремнезёма (SiO2) меньше 67 массовых процентов, её не называют гранитом. Но, в общем, этого очень мало. При одном и том же содержании, пусть того же кремнезёма, порода может содержать и не содержать полезного компонента. Это хорошо видно при просматривании уникального по целому ряду свойств каталога пород ряда диорит-гранит [2], упорядоченном по алфавиту вещественных чисел, точнее, по содержаниям масс% SiO2. То есть, при всей важности первого компонента, нужно учитывать не один, а по возможности, наибольшее количество компонентов, слагающих объект. И учитывать лучше не в любом порядке.
С учётом всего сказанного, названия или аббревиатуры этих частей – компонентов, при разработке языка RHAT, и были приняты за буквы слов, расположенных по снижению их содержаний в объекте, которые были уже упомянуты как ранговые формулы – (R). То есть это рейтинги компонентов, ставшие буквенными, но уже содержательными – качественно-количественными началами рангово-энтропийного кода составов объектов любой природы.
Именно осознание этого послужило импульсом для создания информационного языка и способа сжатого описания составов, то есть кодирования, при этом такого, чтобы коды можно было упорядочивать по алфавитам как слова. В связи с этим к «буквам» этих «слов» — названиям компонентов возникли особые требования, а именно: 1) свойства должны чётко различаться, то есть должны быть дискретными или дискретизируемыми (шкальными) , 2) интенсивности свойств должны быть измеримы, и 3) интенсивности должны быть выражены в одинаковых единицах.
Свойства знаков новых алфавитов. Знаки, обозначающие свойства, должны отвечать особым требованиям.
1) В отличие от национальных языков, где знак алфавита – буква, как правило, содержит один элемент (исключения Й,Ё.Ы), знаки алфавита компонентного языка RHA могут содержать произвольное количество элементов. 2) Знак компонентного алфавита, в отличие от буквы естественного языка, должен иметь смысл и быть понятен, желательно, не только профессионалам. 3) В сложном знаке (словах, аббревиатурах) первый элемент знака должен выделяться прописной (заглавной — OSiAlK) буквой, чтобы при записи последовательности знаков без пробелов обеспечивались их самостоятельность и различение, уплотнение текста и облегчение обозримости формулы. Отсутствие пробелов между знаками возможно в группах, содержащих 4- 6 знаков, учитывая соображения удобства восприятия целой ранговой формулы.
Примеры компонентных алфавитов.
В начале нижеприведённой таблицы показаны два общеизвестных естественных алфавита и далее несколько искусственных – конлангов (сконструированных языков — language). Всё это «компонентные» или «профессионально-компонентные» алфавиты, применяемые для систематизации составов объектов. и, тем самым, облегчения работы с ними.
Итак:
A B C D E F G H I J … – традиционный алфавит английского языка (слабоинтенсиональный).
А Б В Г Д Е Ё Ж З … – традиционный алфавит русского языка (слабоинтенсиональный)
H He Li Be B C N O F… – алфавит конланга химических элементов – Периодическая Система Элементов (интенсиональный). Эта система была использована как алфавит для упорядочения ранговых формул теоретических составов минералов при создании первого в мире словаря, по которому можно находить минерал по его химическому составу [3]. До этого тот же приём был использован для систематизации составов скаполита [4].
ННе HLi HBe HB … HeH HeBe HeB… PuH PuHe PuBe – фрагменты алфавита конланга химических двухкомпонентных составов (соединений и смесей) – алфавитного словника двухбуквенных интенсиональных слов – иерархической Системы 2-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность химического универсума (как всего мыслимого множества) двухкомпонентных составов составляет 8010 вариантов. Интересно было бы определить реальное число, достигает ли оно 20?
HHeLi HHeBe HHeB … HeHLi HeHBe HeHB… PuNpU – фрагменты интенсионального алфавита конланга химических трёхкомпонентных составов (соединений и смесей) ) – иерархической Системы 3-х-компонентных Химических Составов. При учёте 90 элементов, встреченных в природе, мощность универсума трёхкомпонентных составов составляет 704 880. Как видим, увеличение детальности рассмотрения на единицу увеличивает разнообразие в 88 раз. (Как просто одной причиной объяснить явление! И как это может быть от понимания сути далеко … .)
...Serp…Chlr…Verm…Kaol…Anlc…Ntrl…Dolm… – фрагментированный алфавит (здесь пропущены минералы, редко встречающиеся в изверженных породах) конланга минеральных составов горных пород, использованный при создании R-каталога минеральных составов горных пород [5]. Алфавит «минералогического языка» соответствует перечню ранговых формул в упомянутой выше книге «R-словаре химических составов минералов». Этот интенсиональный алфавит предлагается как алфавит для создания Системы Минеральных Составов Горных Пород (СМС ГП) – определителя горных пород по минеральному составу. За ним может быть сделан следующий шаг по построению иерархии сложности геологических образований: созданию каталога геологических структур: вулканов, месторождений, пачек осадочных пород и других геологических объектов для систематизации и поиска аналогов по их «горнопородному составу». Словник для организации горно-породного алфавита, к сожалению, ограниченный изверженными породами, существует в публикации [6]. Порядок компонентов (горных пород) будет соответствовать порядку в СМС ГП.
XNa+ XK+ XCa+ X(G)… VO2- W(OH)— WF—S. V. … – слабоинтенсиональный двухпараметрический алфавит конланга описания кристаллохимической структуры минерала – турмалина [7]. Первый символ – позиция в кристаллической ячейке, второй – ион со своим содержанием в данной позиции. На данном этапе развития идеи каждый тип структуры должен иметь свой алфавит. Упорядочение самих стрктурных типов может быть произведено по ранговым формулами составов типового минерала с использованием химического алфавита — Периодической системы Менделеева. Аналогичные алфавиты возможны для кодирования статистик связи заболеваний с местами проживания, профессий с коррупцией, национальности с преступностью и т.п.
5 10 15 20 25 30 35... – алфавит конланга возрастных распределений населения стран мира [8], алфавит интенсиональный. В демографической литературе, частности в [9, 10], при детальном представлении распределений нередко используется алфавит в виде: 0-4 5-9 10-15 и т.д. . Нелепость закрепившейся и сохраняющейся традиции таких заголовков колонок (вплоть до издания «Россия в цифрах 2919») очевидна — дети в возрастах 4-5, 9-10 14-15 … не отсутствуют и не исключены из учёта. Как видно, много лет авторы боятся, что люди растеряются при учёте, если в день переписи человеку будет точно 20 лет. -он попадёт на границу и достоверность учёта обрушится.
SS BS CS OS – алфавит конланга, созданный для описания шрифтов типа ROMAN [11], неинтенсиональный. Индекс s фиксирует то, что элементы каркаса буквы характеризуются их площадями. Этот алфавит имеет качественную особенность, отличающую его от всех остальных. Здесь символы S,B,C обозначают доли реально измеряемых характеристик знака- буквы «Н» стандартизованной высоты , — соответственно, суммы площадей штамбов, площади перекладины, свободного пространства внутри буквы. При этом остаётся свобода в общей площади буквы: при зафиксированной высоте ширина буквы может быть любой. Площадь буквы в окружающем пространстве ничем не ограничена, -не определена и потому несравнима со всеми другими буквами.
Выход из этой ситуации принципиально важен. Буква — не единственное, что пытаются изучать и изучают, не замечая этого, — изолированно от всего окружающего. Вещь — любая — вне среды, вне окружающего пространства, вне времени её существования — бессмысленна — вырвана из множества всего ей окружающего — похожего и непохожего. Она существует вне связей со всем вмещающим её и потому неконтролируема, неизмерима, несравнима, неупорядочиваема, неузнаваема, неуправляема, не познана основательно, полно,…
Поскольку у стандартизированной по высоте буквы есть неопределённая ширина, дадим ей пространство, в котором она может существовать — жить, — расширяясь, сужаясь, но находясь под контролем. Имея ввиду, что неизвестно, какая ширина буквы может оказаться у дизайнера максимальной, произвольно зададим её сами, сверх всех до сих пор встреченных, но не слишком сильно отличающейся от имеющийся. Так возникло фонтОкно с высотой, равной 1 и шириной 2,168, чем определяется и площадью свободного пространства Os. И тогда, рассчитывая доли площади фонтОкна, включающего букву, получаем достаточно определённое, выделенное из всего бесконечного разнообразия обликов буквы, состояние комплекса из четырёх параметров SBC и доли свободного пространства — O. Возникает трудность отказаться от привычки видеть отдельные буквы, и рассматривать их вне всех прочих. Но, трудность преодолевается сознанием безвыходности положения и возникновением привычки повторять разумное действие.
Ситуация точно та же, что и в геохимических анализах, когда определяют лишь малые — микрокомпоненты — очень важные для многих целей, но игнорируют все основные. Расчёты интегральных характеристик таких анализов заведомо неконтролируемо искажены так же как и в случае шрифтов и во всех других случаях, когда пытаются сравнивать животных по их хвостам. Это только полушутка — в ранжированных математических распределениях удалённую от начала часть обычно и называют хвостом.
В следующей таблице показан пример табличного представления набора ранговых формул разнообразных веществ (пробелы обусловлены размещением символов в ячейках программы Excel.
Этому способу представления составов в 2021 году исполняется 50 лет [13], когда он был продемонстрирован на примере составов изверженных горных пород, в 2003 [4] была опубликована REnAn-колекция, состоявшая из 198 химических составов скаполита В 2010 был издан R-словарь-каталог составов минералов [3], впервые позволивший алфавитно упорядочить минералы НЕ по их названиям, а по преобладанию в них химических элементов. В 2012 в свет вышли две статьи (на русском и английском языках) [7] о первом варианте использования метода для кодирования структур минералов, упорядочение информации минералов с разными структурными типами возможно с использованием имеющегося R-словаря [3]. В 2014 году способ был применён для систематизации возрастных составов населения мира [8-10]. В 2015 и 2019-х годах вышли статьи о систематизации шрифтов [11,12].
Литература
- Петров Т.Г. Обоснование варианта общей классификации геохимических систем. // Вестник ЛГУ.- N18.- 1971. С.30-38.
- Чебанов С.В. Петров Т.Г. Интенсиональность, интенсиональные алфавиты, интенсиональные слова и словари// В сб. Актуальные проблемы современной когнитивной науки. Иваново. 2013 С.239-266. DOI: 10.13140/RG.2.1.4542.8644
- .The scientific data that led to the opening of mineral wealth of Siberia and Mongolia. Ed. A.B.Vistelius. Athens: Theophrastus Publ.- 1995.
- Петров Т.Г., Краснова Н.И. R-словарь-каталог химических составов минералов. СПб, «Наука», 2010, 150 с. Грант РФФИ № 09 — 05 — 07070д
- Золотарев А.А., Петров Т.Г., С.В. Мошкин Особенности химического состава минералов группы скаполита//Записки ВМО, 2003. №6. С. 63-84.
- Petrov Т. G., Moshkin S.V., Krasnova N.l., Bumaeva M.Ju. RHAT- catalog of modal mineral compositions of igneous rocks. ResearchGate Tomas G.Petrov DOI: 10.13140/RG.2.2.33307.31529
- Le Maitre, R. W. (ed.) Igneous Rocks. A Classification and Glossary of Terms. Recommendations of the International Union of Geological Sciences Subcommission on the Systematics of Igneous Rocks, 2nd ed. xvi + 236 pp. Cambridge, New York, Melbourne — 2002.
- Петров Т.Г., Н.И. Краснова RHA-кодирование минерального состава кристаллических горных пород и способ их систематизации. Современные проблемы магматизма и метаморфизма. Т.2 СПб 2012. С.120-123
- Petrov T. G., Andriyanets-Buyko A. A., Moshkin S.V. A Two-Parameter Alphabet for Coding Structural-Chemical Information and its Systematization (Using the Example of Tourmaline)//Automatic Documentation and Mathematical Linguistics, 2012, Vol. 46, No. 1
- Петров Т.Г. Метод RHA для кодирования, систематизации и отображения изменений возрастных составов населения.DOI:10.13140/RG.2.1.3207.2166; Intellectual Archive: Search Archive-All-All-Tomas G. Petrov-1521; Петров Т.Г. Способ RHA для описания и систематизации составов в применении к некоторым задачам демографии.Research Gate DOI: 10.13140/RG.2.1.3878.7040.
- Борисов В.А. Население мира. М.: Мысль. 1989.- 477 с.
- Россия в цифрах. 2008. Краткий статистический сборник. М.: Росстат. 2008. 512 с.
- Петров Т.Г., Н.И. Краснова RHA-кодирование минерального состава кристаллических горных пород и способ их систематизации. Современные проблемы магматизма и метаморфизма. Т.2 СПб 2012. С.120-123
- Петрова Е.Т., Петров Т.Г. Кодирование и систематизация шрифтов на базе информационного языка –метода RHA// Вестник СПГУ Технологии и Дизайна. Сер 2. 2015. №1. С. 39-44
- Петрова Е.Т., Петров Т.Г, Чебанов С.В., Мошкин С.В. Метод кодирования многокомпонентных объектов (RHA) и его применение для упорядочивания шрифтов прямого начертания//Научно-техническая информация НТИ сер 2, 2019 с.28-44; Petrova Е. Т., Petrov T.G., Chebanov S.V., Moshkin S.V. Method of Coding for Multicomponent Objects (RHA) and Its Application for Ordering Roman Fonts//Automatic Documentation and Mathematical Linguistics May 2019. 53(3):143-159 DOI: 10.3103/S000510551903008 https://rdcu.be/bPDmC
Статьи в развитие темы: