Заказать услуги и сервисы со скидкой от 20%
Выделение главных компонент кислородно-конвертерного процесса на основе применения метода PCA (Карунена-Лоэва преобразования)

Аннотация: Описано применение метода PCA (Карунена-Лоэва преобразования) для выделения главных компонентных составляющих кислородно-конвертерного процесса. Произведена технологическая интерпретация 8 выделенных главных компонент для более 75% общей дисперсии.

| Примерное время чтения - 20 минут.

Несмотря на значительные успехи в описании процессов, протекающих в конвертерной ванне в ходе продувки её кислородом, до сих пор отсутствуют чёткие представлений о механизме их эволюций. Общий ход параллельно развивающихся окислительно-восстановительных реакций (часть из которых является конкурирующими и протекающими с различными скоростями) наряду с процессами шлакообразования, газообразования и нагрева, а также наличие целого массива экстремальных состояний, позволяет рассматривать конвертер как сложную – открытую и сильнонеравновесную – систему с переменной структурой внутренних связей [1].

Существуют различные вероятностно-статистические методы определения внутренних взаимосвязей сложных многокомпонентных процессов, основанных на анализе временных рядов генерируемых по воду данных процессов. При этом, согласнообщей теории случайных процессов, большинство из этих методов опирается на гипотезы о Гауссовском законе распределения вероятностей, и о линейности, как во внутренней взаимосвязи одного временного ряда, так и во взаимосвязях различных временных рядов между собой [2]. Вместе с тем, исследования последних лет установили, что механизм генерации случайных процессов в большинстве практических задач, в том числе и металлургических, носит нелинейный характер [3].

Известно, что любую временную последовательность можно разложить на компонентные (параллельные) составляющие с помощью заранее заданных базисов, в качестве которых выступают, например, ряд Фурье, Тейлора, Макларена, Уолша и т.д. Обычно все эти базисы являются ортонормированными: компоненты базиса ортогональны и приведены к единичной норме. Наиболее широкое распространение при анализе временных рядов получил базис, основанный на разложении в ряд Фурье. Теоретически доказано, что устремив количество членов в ряде Фурье до бесконечности, временную последовательность можно аппроксимировать с любой точностью, если заранее постулировано из технологических соображений, что временная последовательность порождается суммой гармонических составляющих и, кроме того, анализируемый ряд является стационарным[4].

В качестве метода разложения, базис которого зависит от процесса и заранее не известен, предлагается применениеКарунена-Лоэва разложения (КЛ-разложение, КЛ-преобразование). Собственные вектора, получаемые в ходе процесса, будут представлять собой базис функций Карунена-Лоэва разложения, а собственные значения своей величиной определят степень присутствия конкретного элемента базиса в анализируемом массиве входных и выходныхпараметров плавки.

КЛ-разложение, известное также как метод главных компонент, собственное ортогональное разложение, преобразование Хоттелинга (дискретный вариант разложения), эмпирическое разложение на собственные функции и т.д. [5]. Этот подход позволяет определить внутренние механизмы, генерирующие выходные сигналы. Поскольку, если известен порождающий механизм, то можно осуществлять долгосрочное прогнозирование сигнала, вскрывая при этом первопричины этих изменений.

В конце 70-хх годов XX века КЛ-разложение уже применялось в металлургии для исследования процессов, протекающих в доменной печи[2]. Однако в последующих источниках, применительно к конверторному переделу, не было найдено дальнейшего развития этого метода исследований.

КЛ-разложение применяется для выделения из анализируемого массива данных отдельных подмножеств переменных, коррелирующих между собой, и при этом в значительной степени независимых от переменных из других подмножеств, которые образуют компоненты (собственные вектора). Основная цель данного метода – четко выделить и дать значимую технологическую интерпретацию явно не наблюда­емым компонентам (явлениям) с помощью множества входных и выходных параметров плавки.

Выделяемые главные компоненты интерпретируются в зависимости от фактической комбинации входящих в него параметров, имеющих с ними наивысшую корреляцию, и не коррелирующие с другими компонентами. При этом определяющий компонент набор параметров обычно включает в себя не менее 3 параметров [6].

Неотменяемой частью решения в ходе КЛ-разложения является преобразование, заключающееся в повороте компонентов. Это процесс, основанный на максимизации высоких корреляций и минимизации низких, и как следствия, – получения более простой структуры данных. Повороты компонентов бывают двух типов – ортогональные (корреляции между получаемыми компонентами равны нулю) и косоугольные (допускаются корреляции между получаемыми компонентами).

Чем больше компонентная нагрузка, тем с большей уверенностью можно считать, что переменная детерминирует главный компонент. Считается [7], что нагруз­ки, превышающие 0.71 (объясняет 50% дисперсии), – превосходные, 0.63 (40% дисперсии) – очень хорошие, 0.55 (30%) – хорошие, 0.45 (20%) – удовлетворитель­ные и 0.32 (объясняет 10% дисперсии) – слабые. Важно учесть, что по первым трем компонентам, имеющим наибольшие собственные значения и собственные вектора с самыми высокими нагрузками, граница от­сечения величины нагрузок для интерпретации (т.е. зна­чение, начиная с которого переменные, имеющие боль­шую компонентную нагрузку, включаются в группу для интерпретации), как правило, не ниже 0.45. C четвертой и последующих компонент приемлемыми считаются значения в диапазоне 0.32-0.25.

Для завершения процедуры отбора параметров, определяющих компоненты, по каждому параметру (строке) выделяется наибольшая по абсолютной величине нагрузка, которая определяется как доминирующая. Если вторая по величине нагрузка в строке отличается от выделенной (доминирующей), но менее чем на 0.2, то она тоже выделяется, но уже как второстепенная [8].

На результаты, получаемые в ходе КЛ-разложения, существенное влияние оказывает размер выборки исходныхпараметров: 50 параметров, оцени­вается как очень плохая, 100 – плохая, 200 – средняя, 300 – хорошая, 500 – очень хорошая и 1000 – пре­восходная [5].

Применительно к данной работе, уравнение Карунена-Лоэва разложения примет вид [6]:

zj = j=1 m ajm Fm, где zj – наблюдаемая латентная переменная, которая линейно зависит от m некоррелированных между собой и упорядоченных по величине вклада в суммарную дисперсию признаков компонент F1, F2, …, Fm ; m – число анализируемых признаков. Коэффициенты при общих факторах aji называются компонентными нагрузками и представляют собой корреляцию Пирсона между переменными и общими компонентами, отражая меру влияния выделяемого главного компонента на признак.

Матричная форма уравнения КЛ-преобразования через сингулярное разложение матрицы исходных параметров А размерности m × n и m > n, примет вид:

A=UVT, где U – унитарная матрица размера m × m, V – унитарная матрица размера n × n, а ∑ – диагональная матрица m × n (т.е. такого же размера, как и A). Матрица U представляет собой набор собственных векторов матрицы AAH, а матрица V – набор собственных векторов матрицы AHA, где оператор H означает эрмитово сопряжение.

Если анализируемая корреляционная матрица является ленточной (т.е. элементы, параллельные главной диагонали, одинаковы), а, следовательно, процесс является стационарным, то рассчитанные собственные вектора воспроизведут гармонические составляющие ряда Фурье. При наличии существенной нестационарности собственные вектора будут значительно отличаться от членов ряда Фурье, отражая специфические особенности нестационарного поведения анализируемого ансамбля параметров [5].

Для выделения компонентных составляющих (параллельное разложение) ансамбля входных и выходных параметров плавок с применением КЛ-разложения применялось бесплатное программное обеспечение R, и осуществлялось по 40 параметрам, регистрируемым в ходе 163 последовательных плавок Череповецкого металлургического комбината.

Входными параметрами конвертерной плавки считаются характеристики поступающих в конвертер мате­риальных и энергетических потоков, которые влияют на выходные переменные и не зависят от происходящих в конвертере процессов. Переменные входящие в состав входных параметров являются векторными величинами по времени плавки.