Разбор промышленных архивов — RD[AI]
RD[AI]Заказать аудит
Промышленные архивы

Промышленные архивы → структурированные данные

Разбираем legacy-документацию промышленных объектов: PDF, сканы, чертежи, P&ID, SCADA-логи, переписку проектировщиков. На выходе — единый источник правды для эксплуатации, проектирования и интегратора.

Почему мы предлагаем начать с аудита

Зачем это нужно

  • Понять реальное состояние архива до дорогого внедрения СУИД/EAM/ТОиР. Без оценки архива проект выходит в полтора–2 раза дороже сметы.
  • Снизить риск срыва этапа внедрения из-за грязных или неполных данных. Аудит показывает дубли, пробелы и конфликты имён до старта.
  • Не тратить инженеров на ручной разбор сотен папок. Работаем на своём инструменте, от команды заказчика нужна только сверка.
  • Получить оценку бюджета за 5 дней, а не за квартал внутренних совещаний. Фиксированная цена, письменный отчёт, без vendor lock-in.

Скачать КП «Экспресс-аудит инженерного архива» (PDF, 2 страницы)

Контекст

Что обычно лежит в промышленном архиве

Пять типичных групп источников. У всех — одни и те же проблемы: разрозненность, дубли, нет индексации, нет связей между системами.

Сканы старых чертежей

JPG, TIFF без OCR. Подписи от руки, разные годы, разная нотация.

PDF-документация

Паспорта оборудования, регламенты, разрозненные версии без единого реестра.

SCADA, АСУ ТП и OPC UA

Адресное пространство OPC UA, теги SCADA без описаний, дубли идентификаторов, выгрузки журналов и алармов. Разные таймзоны и форматы.

Справочники EAM, CMMS, ТОиР

Инвентарные номера, журналы обслуживания, истории отказов. Часто несвязаны со SCADA-тегами и P&ID — один объект под разными ID в каждой системе.

Переписка проектировщиков

Email-цепочки и мессенджеры. Ключевые решения принимались внутри писем.

Когда нужно найти параметр насоса или причину аварии 2018 года — поиск занимает дни вместо минут.

Результат

Что вы получаете на выходе

Все файлы в открытых форматах. Без vendor lock-in, без облака на нашей стороне.

  1. 1Реестр оборудования (Excel/CSV)Все объекты с уникальными ID, параметрами и ссылками на исходники.
  2. 2Паспорта оборудования (PDF)Единый шаблон, сверенные данные, маркировки и история изменений.
  3. 3Схемы и P&IDВосстановленные, оцифрованные, с единой нотацией. PDF + исходники.
  4. 4База знаний (Markdown/Wiki)Структурированные решения, аварии и регламенты. Доступна поиском.
  5. 5План миграции для интегратора (DOCX)Что и в каком порядке передавать на следующий этап проекта.

Как выглядит строка в реестре

«Четыре источника. Один прибор. Ни одного совпадения.»
— из статьи на isicad.ru

Пример из реальной практики: один центробежный насос — четыре обозначения в разных системах. Master ID сводит их в один объект. Столбец source показывает, откуда взяты данные — из архива заказчика или из внешних источников (вторые всегда помечаются как external и требуют валидации).

Master IDТипKKS-тегАльтернативные именаДокумент-источникSCADA-тегSource
MID-00427Насос центробежный21-P-0101НС-01А; инв. #3482P&ID-21-001.pdf, лист 3AI_204archive
MID-00428Насос центробежный (резерв)21-P-0101BНС-01Б; инв. #3483Паспорт производителя, каталог 2022AI_205external · medium
MID-00429Теплообменник21-E-0204ТО-204; инв. #3501 конфликт инв. №Спецификация-04.xlsx, стр. 12TI_311archive

archive — данные из документов заказчика. external — восстановлено из открытых источников (производитель, ГОСТ, Ростехнадзор, отраслевые каталоги) и требует подтверждения заказчика. Конфликты помечаются явно — мы не перезаписываем, а фиксируем разногласие.

Traceability: каждое поле возвращается к источнику

Ссылка на источник

У каждого параметра — путь до исходного файла, страницы и строки. Главный инженер за минуту проверяет, откуда взято значение.

Маркировка конфликтов

Если документы расходятся, мы не выбираем «правильный» вариант сами. Конфликт отмечается в реестре, выносится в отдельный список и согласуется с заказчиком.

Версионность

Каждое изменение в реестре фиксируется: кто, когда, на каком основании. История доступна в открытом формате — без зависимости от нашей системы.

Master ID

Один объект — пять имён в разных документах

«ЦНС-60», «pump-03», «#4812», «K-205/НЦ», «TsNS60» — это один и тот же насос в пяти системах. Мы сводим имена в Master ID и решаем эту проблему один раз.

Master ID — не «ещё одна система». Это таблица соответствий в Excel/CSV, которая подключается к 1С, КИП, MES, ремонтной документации. Делаем эту таблицу один раз и передаём вам.

Обогащение пробелов

Что мы делаем, когда документа нет в архиве

В реальных архивах 15–40 % паспортов, мануалов и формуляров либо утрачены, либо были на бумаге и не сохранились. Заказчик не должен сам искать недостающие документы. Мы восстанавливаем их из доступных открытых источников — каталогов производителей, отраслевых справочников, реестров надзорных органов — и помечаем источник в таблице.

Пример 1

Насос КМН-200

Паспорт в архиве не найден. Технические характеристики восстановлены по каталогу производителя. Внесены в Master ID с пометкой источника. Согласованы с главным механиком цеха.

source: external · confidence: medium

Пример 2

Регулятор температуры

Мануал в архиве отсутствует. Параметры восстановлены из открытых отраслевых каталогов по серийному номеру. Характеристики подтверждены инженером АСУ ТП.

source: external · confidence: medium

Пример 3

Сосуд под давлением

Паспорт утрачен. Регистрационные данные получены из реестра Ростехнадзора. Характеристики подтверждены службой промбезопасности заказчика.

source: external · confidence: high

Четыре уровня работы с архивом

Большинство подрядчиков останавливается на первом уровне. Мы доводим работу до четвёртого — где заказчик принимает данные и подписывает результат.

УРОВЕНЬ 1

Извлечение

Распознавание сканов, выгрузка из PDF, разбор рукописных журналов в структурированные данные.

Делают: Деснол, УльтимаТек, Галактика, RD[AI]

УРОВЕНЬ 2

Аудит полноты

Сверка по списку оборудования: что есть, чего нет, где пробелы. Отчёт по каждому типу документов.

Делают: единичные подрядчики, RD[AI]

УРОВЕНЬ 3

Обогащение из внешних источников

Восстановление недостающих характеристик из открытых каталогов и реестров. Источник и уровень доверия фиксируются в таблице как source/confidence.

Делаем: только RD[AI]

УРОВЕНЬ 4

Валидация заказчиком

Внешние данные не считаются достоверными, пока их не подтвердили инженер АСУ ТП, главный механик или служба промбезопасности. Только после этого Master ID считается готовым.

Подписывают: технические службы заказчика

Юридическая рамка: данные из внешних источников до подтверждения заказчиком имеют статус справочных и не являются основанием для принятия эксплуатационных решений. Это фиксируется в договоре отдельным пунктом.

Безопасность и контур

Чувствительные данные не выходят за периметр

Мы работаем с архивами, в которых есть персональные данные, коммерческая тайна и чувствительные технические сведения. Правила обращения с ними заложены в сам процесс — не в инструкцию, а в архитектуру.

Маскирование

Не передаём в LLM открытые значения

Чувствительные данные не передаются в LLM в открытом виде. Перед обработкой они маскируются, обезличиваются или заменяются токенами. Обратная связь с исходными значениями хранится внутри контура.

Контур RD[AI]

Исходники и логика остаются внутри

Исходные значения и логика обработки остаются внутри контролируемого контура RD[AI]. Во внешний шаг попадает только минимально необходимый фрагмент — ровно столько, сколько нужно для конкретной операции.

Ограниченная выдача

Подрядчики получают достаточно, но не всё

Интеграторы и внешние подрядчики получают достаточный объём результатов для пилота и внедрения — но не полный массив и не весь чертёж решения. Каждый уровень доступа фиксируется в договоре.

Дополнительно согласуем схему обработки персональных данных и оформляем сопутствующие документы — согласие на обработку ПДн и политику конфиденциальности.

Процесс

Как идёт работа

Семь шагов от первого звонка до сдачи пакета. Без чёрных ящиков.

1Аудит архива — 5 рабочих дней, 150 000 ₽
Получаем доступ к архиву (физический, сетевой или копия). Считаем объём, типы данных, готовность. Возвращаем карту данных и план работ. По результату — фиксированная смета на проект.
2План разбора и нотация
Договариваемся об именовании, версионировании, форматах выгрузки. Согласуем с интегратором и эксплуатацией, чтобы результат подошёл всем.
3Извлечение данных
OCR сканов, разбор PDF, расшифровка SCADA-логов, перенос переписки в структурированные заметки. Каждая запись связана с исходником.
4Сведение — Master ID
Дубли, разнобой имён, конфликты версий решаются по чётким правилам. Все правила фиксируем в документации.
5Обогащение
Достраиваем недостающие атрибуты — производитель, модель, диапазоны, паспортные параметры, связь с EAM — из паспортов, справочников и каталогов производителей. Когда внутри пусто, дотягиваем из открытых отраслевых источников. Оригинал не переписываем, всё добавляется в рабочий слой со ссылкой на источник. Каждое обогащённое поле помечается отдельно, чтобы инженеры на местах могли его проверить и подтвердить.
6Верификация
Прогон по чеклистам, сверка с эксплуатацией и проектировщиком. Спорные позиции отмечаем — финальное решение за заказчиком.
7Передача и сопровождение
Передаём пакет в выбранных форматах. Месяц гарантии: правим то, что вылезло в реальной работе.
Воронка работы

От чеклиста до проекта

Не обязательно сразу заказывать проект. Можно начать с чеклиста или аудита и принять решение по фактам.

1
Чеклист готовности
Бесплатно, 1 страница, 7 пунктов
Скачать PDF
2
Аудит архива
150 000 ₽, 5 рабочих дней
Заказать
3
Пилот
От 350 000 ₽, 2–4 недели — обсуждается после аудита
4
Проект
От 1 500 000 ₽, 2–6 месяцев — обсуждается после пилота

Цены ориентировочные, финальные — после аудита. Аудит засчитывается в стоимость проекта.

Калькулятор

Сколько вам обходится неразобранный архив

Грубая оценка. Реальные цифры зависят от объёма и индустрии — показываем после аудита.

1–200
1–60
Рынок 2500–6000 ₽
0–50
Примеры задач

Что мы делаем на практике

Сводные примеры по типам задач. Реальные кейсы — под NDA, готовы обсудить детали на звонке.

Методология «Master ID + traceability» проверена на данных, аналогичных публичному кейсу Сибур Диджитал на Хабре: объединение разнородных источников, разбор конфликтов, передача в EAM/СУИД.

Нефтехимия

Разбор архива установки

12 ТБ → 340 P&ID за 6 недель

Архив установки за 30 лет: бумажные чертежи в сканах, PDF-паспорта в разных версиях, регламенты в письмах. Восстановили 340 P&ID в едином формате, собрали реестр 4 800 единиц оборудования с Master ID. Передали интегратору пакет под модернизацию АСУ ТП.

Энергетика

Master ID для филиала

5 систем → 1 справочник, 18 000 объектов

В филиале сетевой компании одно и то же оборудование называлось по-разному в 1С, КИП, MES, ремонтной системе и Excel-картотеке. Сделали единый Master ID и таблицу соответствий. Время подготовки отчёта о состоянии оборудования: с 3 дней до 4 часов.

Машиностроение

Переписка как источник данных

15 лет писем → 2 100 решений

Архив переписки проектного отдела: ключевые решения 15 лет принимались в письмах и Skype. Извлекли 2 100 структурированных записей «проблема → решение → ответственный → последствия», связали с оборудованием по Master ID. Новые инженеры входят в проект за дни вместо месяцев.

FAQ

Частые вопросы

Чем вы отличаетесь от системного интегратора?
Интегратор проектирует и внедряет систему. Мы готовим данные до этой работы: разбираем legacy, собираем источник правды, чтобы интегратору не пришлось это делать ручками. Часто работаем в одной связке с интегратором по запросу заказчика.
Что с защитой данных? Архивы могут быть чувствительными.
Защиту данных мы закладываем в сам процесс. Чувствительные значения не передаются в LLM в открытом виде — перед обработкой маскируются, обезличиваются или заменяются токенами. Исходные данные и логика обработки остаются внутри контролируемого контура RD[AI], во внешний шаг попадает только минимально необходимый фрагмент. Подробнее — в блоке «Безопасность и контур» выше. Дополнительно согласуем схему обработки персональных данных и оформляем сопутствующие документы — согласие, политику конфиденциальности.
Сколько стоит проект целиком?
От 1 500 000 ₽ за пилотную часть, дальше зависит от объёма. Точная смета — после аудита (150 000 ₽). Аудит засчитывается в стоимость, если решите продолжать.
Сколько времени занимает разбор архива?
Аудит — 5 рабочих дней. Пилот — 2–4 недели. Полный проект — 2–6 месяцев в зависимости от объёма. Реальные сроки фиксируются после аудита.
Что, если у нас нет полного архива? Часть документов утеряна.
Это типичная ситуация. На аудите оцениваем, что есть, что критически отсутствует, что можно восстановить через переписку и опрос инженеров. Делаем карту пробелов и предложение, как их закрывать.
Можем ли мы потом сами поддерживать результат?
Да. Все файлы в открытых форматах (Excel, DOCX, PDF, Markdown). После проекта проводим обучение и передачу. Сопровождение — по желанию, по фиксированной ставке.
Начнём

Начнём с аудита

150 000 ₽

5 рабочих дней. Карта данных, оценка объёма, дорожная карта проекта.

  • Описание состояния архива по типам
  • Список рисков и пробелов
  • Оценка сроков и стоимости полного проекта
  • Рекомендации, что разбирать в первую очередь

Аудит засчитывается в стоимость проекта. Скачать коммерческое предложение (PDF)

Чек-лист приёмки: по чему проверяем результат

  • Карта данных по типам источников и передана заказчику в открытых форматах (Excel/CSV, PDF)
  • Оценка объёма и состояния архива по каждому типу документов
  • Список рисков и пробелов с приоритетом по влиянию на ТОиР / АСУ ТП
  • Перечень пробелов, закрытых из внешних источников, с пометкой source/confidence и протоколом подтверждения технической службой заказчика
  • Дорожная карта полного проекта с этапами, сроками и стоимостью
  • Рекомендации, что разбирать в первую очередь — с привязкой к бюджету и команде