Что, если архив неполный?

На аудите оцениваем, что есть и что критически отсутствует. Делаем карту пробелов и предложение по их закрытию.

Промышленные архивы

Промышленные архивы → структурированные данные

Q: Что с защитой данных?

Чувствительные данные не передаются в LLM в открытом виде — перед обработкой они маскируются, обезличиваются или заменяются токенами. Исходные значения и логика обработки остаются внутри контролируемого контура RD[AI]. Во внешний шаг попадает только минимально необходимый фрагмент. Дополнительно согласуем схему обработки персональных данных и оформляем сопутствующие документы.

Q: Сколько стоит проект целиком?

От 1 500 000 ₽ за пилотную часть. Точная смета после аудита (150 000 ₽). Аудит засчитывается в стоимость.

Q: Можем ли мы потом сами поддерживать результат?

Да. Все файлы в открытых форматах. После проекта проводим обучение и передачу.

Разбираем legacy-документацию промышленных объектов: PDF, сканы, чертежи, P&ID, SCADA-логи, переписку проектировщиков. На выходе — единый источник правды для эксплуатации, проектирования и интегратора.

Заказать аудит за 150 000 ₽ Скачать чеклист

Почему мы предлагаем начать с аудита

Зачем это нужно

Понять реальное состояние архива до дорогого внедрения СУИД/EAM/ТОиР. Без оценки архива проект выходит в полтора–2 раза дороже сметы.
Снизить риск срыва этапа внедрения из-за грязных или неполных данных. Аудит показывает дубли, пробелы и конфликты имён до старта.
Не тратить инженеров на ручной разбор сотен папок. Работаем на своём инструменте, от команды заказчика нужна только сверка.
Получить оценку бюджета за 5 дней, а не за квартал внутренних совещаний. Фиксированная цена, письменный отчёт, без vendor lock-in.

Скачать КП «Экспресс-аудит инженерного архива» (PDF, 2 страницы)

Контекст

Что обычно лежит в промышленном архиве

Пять типичных групп источников. У всех — одни и те же проблемы: разрозненность, дубли, нет индексации, нет связей между системами.

Сканы старых чертежей

JPG, TIFF без OCR. Подписи от руки, разные годы, разная нотация.

PDF-документация

Паспорта оборудования, регламенты, разрозненные версии без единого реестра.

SCADA, АСУ ТП и OPC UA

Адресное пространство OPC UA, теги SCADA без описаний, дубли идентификаторов, выгрузки журналов и алармов. Разные таймзоны и форматы.

Справочники EAM, CMMS, ТОиР

Инвентарные номера, журналы обслуживания, истории отказов. Часто несвязаны со SCADA-тегами и P&ID — один объект под разными ID в каждой системе.

Переписка проектировщиков

Email-цепочки и мессенджеры. Ключевые решения принимались внутри писем.

Когда нужно найти параметр насоса или причину аварии 2018 года — поиск занимает дни вместо минут.

Результат

Что вы получаете на выходе

Все файлы в открытых форматах. Без vendor lock-in, без облака на нашей стороне.

1Реестр оборудования (Excel/CSV)Все объекты с уникальными ID, параметрами и ссылками на исходники.
2Паспорта оборудования (PDF)Единый шаблон, сверенные данные, маркировки и история изменений.
3Схемы и P&IDВосстановленные, оцифрованные, с единой нотацией. PDF + исходники.
4База знаний (Markdown/Wiki)Структурированные решения, аварии и регламенты. Доступна поиском.
5План миграции для интегратора (DOCX)Что и в каком порядке передавать на следующий этап проекта.

Как выглядит строка в реестре

«Четыре источника. Один прибор. Ни одного совпадения.»
— из статьи на isicad.ru

Пример из реальной практики: один центробежный насос — четыре обозначения в разных системах. Master ID сводит их в один объект. Столбец source показывает, откуда взяты данные — из архива заказчика или из внешних источников (вторые всегда помечаются как external и требуют валидации).

Master ID	Тип	KKS-тег	Альтернативные имена	Документ-источник	SCADA-тег	Source
`MID-00427`	Насос центробежный	`21-P-0101`	НС-01А; инв. #3482	P&ID-21-001.pdf, лист 3	`AI_204`	archive
`MID-00428`	Насос центробежный (резерв)	`21-P-0101B`	НС-01Б; инв. #3483	Паспорт производителя, каталог 2022	`AI_205`	external · medium
`MID-00429`	Теплообменник	`21-E-0204`	ТО-204; инв. #3501 конфликт инв. №	Спецификация-04.xlsx, стр. 12	`TI_311`	archive

archive — данные из документов заказчика. external — восстановлено из открытых источников (производитель, ГОСТ, Ростехнадзор, отраслевые каталоги) и требует подтверждения заказчика. Конфликты помечаются явно — мы не перезаписываем, а фиксируем разногласие.

Traceability: каждое поле возвращается к источнику

Ссылка на источник

У каждого параметра — путь до исходного файла, страницы и строки. Главный инженер за минуту проверяет, откуда взято значение.

Маркировка конфликтов

Если документы расходятся, мы не выбираем «правильный» вариант сами. Конфликт отмечается в реестре, выносится в отдельный список и согласуется с заказчиком.

Версионность

Каждое изменение в реестре фиксируется: кто, когда, на каком основании. История доступна в открытом формате — без зависимости от нашей системы.

Master ID

Один объект — пять имён в разных документах

«ЦНС-60», «pump-03», «#4812», «K-205/НЦ», «TsNS60» — это один и тот же насос в пяти системах. Мы сводим имена в Master ID и решаем эту проблему один раз.

Master ID — не «ещё одна система». Это таблица соответствий в Excel/CSV, которая подключается к 1С, КИП, MES, ремонтной документации. Делаем эту таблицу один раз и передаём вам.

Обогащение пробелов

Что мы делаем, когда документа нет в архиве

В реальных архивах 15–40 % паспортов, мануалов и формуляров либо утрачены, либо были на бумаге и не сохранились. Заказчик не должен сам искать недостающие документы. Мы восстанавливаем их из доступных открытых источников — каталогов производителей, отраслевых справочников, реестров надзорных органов — и помечаем источник в таблице.

Пример 1

Насос КМН-200

Паспорт в архиве не найден. Технические характеристики восстановлены по каталогу производителя. Внесены в Master ID с пометкой источника. Согласованы с главным механиком цеха.

source: external · confidence: medium

Пример 2

Регулятор температуры

Мануал в архиве отсутствует. Параметры восстановлены из открытых отраслевых каталогов по серийному номеру. Характеристики подтверждены инженером АСУ ТП.

source: external · confidence: medium

Пример 3

Сосуд под давлением

Паспорт утрачен. Регистрационные данные получены из реестра Ростехнадзора. Характеристики подтверждены службой промбезопасности заказчика.

source: external · confidence: high

Четыре уровня работы с архивом

Большинство подрядчиков останавливается на первом уровне. Мы доводим работу до четвёртого — где заказчик принимает данные и подписывает результат.

УРОВЕНЬ 1

Извлечение

Распознавание сканов, выгрузка из PDF, разбор рукописных журналов в структурированные данные.

Делают: Деснол, УльтимаТек, Галактика, RD[AI]

УРОВЕНЬ 2

Аудит полноты

Сверка по списку оборудования: что есть, чего нет, где пробелы. Отчёт по каждому типу документов.

Делают: единичные подрядчики, RD[AI]

УРОВЕНЬ 3

Обогащение из внешних источников

Восстановление недостающих характеристик из открытых каталогов и реестров. Источник и уровень доверия фиксируются в таблице как source/confidence.

Делаем: только RD[AI]

УРОВЕНЬ 4

Валидация заказчиком

Внешние данные не считаются достоверными, пока их не подтвердили инженер АСУ ТП, главный механик или служба промбезопасности. Только после этого Master ID считается готовым.

Подписывают: технические службы заказчика

Юридическая рамка: данные из внешних источников до подтверждения заказчиком имеют статус справочных и не являются основанием для принятия эксплуатационных решений. Это фиксируется в договоре отдельным пунктом.

Безопасность и контур

Чувствительные данные не выходят за периметр

Мы работаем с архивами, в которых есть персональные данные, коммерческая тайна и чувствительные технические сведения. Правила обращения с ними заложены в сам процесс — не в инструкцию, а в архитектуру.

Маскирование

Не передаём в LLM открытые значения

Чувствительные данные не передаются в LLM в открытом виде. Перед обработкой они маскируются, обезличиваются или заменяются токенами. Обратная связь с исходными значениями хранится внутри контура.

Контур RD[AI]

Исходники и логика остаются внутри

Исходные значения и логика обработки остаются внутри контролируемого контура RD[AI]. Во внешний шаг попадает только минимально необходимый фрагмент — ровно столько, сколько нужно для конкретной операции.

Ограниченная выдача

Подрядчики получают достаточно, но не всё

Интеграторы и внешние подрядчики получают достаточный объём результатов для пилота и внедрения — но не полный массив и не весь чертёж решения. Каждый уровень доступа фиксируется в договоре.

Дополнительно согласуем схему обработки персональных данных и оформляем сопутствующие документы — согласие на обработку ПДн и политику конфиденциальности.

Процесс

Как идёт работа

Семь шагов от первого звонка до сдачи пакета. Без чёрных ящиков.

1Аудит архива — 5 рабочих дней, 150 000 ₽

Получаем доступ к архиву (физический, сетевой или копия). Считаем объём, типы данных, готовность. Возвращаем карту данных и план работ. По результату — фиксированная смета на проект.

2План разбора и нотация

Договариваемся об именовании, версионировании, форматах выгрузки. Согласуем с интегратором и эксплуатацией, чтобы результат подошёл всем.

3Извлечение данных

OCR сканов, разбор PDF, расшифровка SCADA-логов, перенос переписки в структурированные заметки. Каждая запись связана с исходником.

4Сведение — Master ID

Дубли, разнобой имён, конфликты версий решаются по чётким правилам. Все правила фиксируем в документации.

5Обогащение

Достраиваем недостающие атрибуты — производитель, модель, диапазоны, паспортные параметры, связь с EAM — из паспортов, справочников и каталогов производителей. Когда внутри пусто, дотягиваем из открытых отраслевых источников. Оригинал не переписываем, всё добавляется в рабочий слой со ссылкой на источник. Каждое обогащённое поле помечается отдельно, чтобы инженеры на местах могли его проверить и подтвердить.

6Верификация

Прогон по чеклистам, сверка с эксплуатацией и проектировщиком. Спорные позиции отмечаем — финальное решение за заказчиком.

7Передача и сопровождение

Передаём пакет в выбранных форматах. Месяц гарантии: правим то, что вылезло в реальной работе.

Воронка работы

От чеклиста до проекта

Не обязательно сразу заказывать проект. Можно начать с чеклиста или аудита и принять решение по фактам.

Чеклист готовности

Бесплатно, 1 страница, 7 пунктов

Скачать PDF

Аудит архива

150 000 ₽, 5 рабочих дней

Заказать

Пилот

От 350 000 ₽, 2–4 недели — обсуждается после аудита

Проект

От 1 500 000 ₽, 2–6 месяцев — обсуждается после пилота

Цены ориентировочные, финальные — после аудита. Аудит засчитывается в стоимость проекта.

Калькулятор

Сколько вам обходится неразобранный архив

Грубая оценка. Реальные цифры зависят от объёма и индустрии — показываем после аудита.

Инженеров, которые ищут данные 1–200

Часов в неделю на одного 1–60

Стоимость инженер-часа, ₽ Рынок 2500–6000 ₽

Простоев / штрафов в год 0–50

Публикации

Методология описана в профильной прессе

Подход «Master ID + traceability» вынесён в открытую публикацию для инженерного сообщества.

isicad.ru · статья

Данные прежде всего: как подготовить инженерный архив действующего объекта к ИИ, ТОиР и цифровому двойнику

Почему тендеры в классе СУИД регулярно не находят исполнителей, и как трёхэтапная методология «извлечение — нормализация — связывание» решает эту проблему на действующих промышленных объектах.

Читать на isicad.ru →

Примеры задач

Что мы делаем на практике

Сводные примеры по типам задач. Реальные кейсы — под NDA, готовы обсудить детали на звонке.

Методология «Master ID + traceability» проверена на данных, аналогичных публичному кейсу Сибур Диджитал на Хабре: объединение разнородных источников, разбор конфликтов, передача в EAM/СУИД.

Нефтехимия

Разбор архива установки

12 ТБ → 340 P&ID за 6 недель

Архив установки за 30 лет: бумажные чертежи в сканах, PDF-паспорта в разных версиях, регламенты в письмах. Восстановили 340 P&ID в едином формате, собрали реестр 4 800 единиц оборудования с Master ID. Передали интегратору пакет под модернизацию АСУ ТП.

Энергетика

Master ID для филиала

5 систем → 1 справочник, 18 000 объектов

В филиале сетевой компании одно и то же оборудование называлось по-разному в 1С, КИП, MES, ремонтной системе и Excel-картотеке. Сделали единый Master ID и таблицу соответствий. Время подготовки отчёта о состоянии оборудования: с 3 дней до 4 часов.

Машиностроение

Переписка как источник данных

15 лет писем → 2 100 решений

Архив переписки проектного отдела: ключевые решения 15 лет принимались в письмах и Skype. Извлекли 2 100 структурированных записей «проблема → решение → ответственный → последствия», связали с оборудованием по Master ID. Новые инженеры входят в проект за дни вместо месяцев.

FAQ

Частые вопросы

Чем вы отличаетесь от системного интегратора?

Интегратор проектирует и внедряет систему. Мы готовим данные до этой работы: разбираем legacy, собираем источник правды, чтобы интегратору не пришлось это делать ручками. Часто работаем в одной связке с интегратором по запросу заказчика.

Что с защитой данных? Архивы могут быть чувствительными.

Защиту данных мы закладываем в сам процесс. Чувствительные значения не передаются в LLM в открытом виде — перед обработкой маскируются, обезличиваются или заменяются токенами. Исходные данные и логика обработки остаются внутри контролируемого контура RD[AI], во внешний шаг попадает только минимально необходимый фрагмент. Подробнее — в блоке «Безопасность и контур» выше. Дополнительно согласуем схему обработки персональных данных и оформляем сопутствующие документы — согласие, политику конфиденциальности.

Сколько стоит проект целиком?

От 1 500 000 ₽ за пилотную часть, дальше зависит от объёма. Точная смета — после аудита (150 000 ₽). Аудит засчитывается в стоимость, если решите продолжать.

Сколько времени занимает разбор архива?

Аудит — 5 рабочих дней. Пилот — 2–4 недели. Полный проект — 2–6 месяцев в зависимости от объёма. Реальные сроки фиксируются после аудита.

Что, если у нас нет полного архива? Часть документов утеряна.

Это типичная ситуация. На аудите оцениваем, что есть, что критически отсутствует, что можно восстановить через переписку и опрос инженеров. Делаем карту пробелов и предложение, как их закрывать.

Можем ли мы потом сами поддерживать результат?

Да. Все файлы в открытых форматах (Excel, DOCX, PDF, Markdown). После проекта проводим обучение и передачу. Сопровождение — по желанию, по фиксированной ставке.

Начнём

Начнём с аудита

150 000 ₽

5 рабочих дней. Карта данных, оценка объёма, дорожная карта проекта.

Описание состояния архива по типам
Список рисков и пробелов
Оценка сроков и стоимости полного проекта
Рекомендации, что разбирать в первую очередь

Аудит засчитывается в стоимость проекта. Скачать коммерческое предложение (PDF)

Чек-лист приёмки: по чему проверяем результат

Карта данных по типам источников и передана заказчику в открытых форматах (Excel/CSV, PDF)
Оценка объёма и состояния архива по каждому типу документов
Список рисков и пробелов с приоритетом по влиянию на ТОиР / АСУ ТП
Перечень пробелов, закрытых из внешних источников, с пометкой source/confidence и протоколом подтверждения технической службой заказчика
Дорожная карта полного проекта с этапами, сроками и стоимостью
Рекомендации, что разбирать в первую очередь — с привязкой к бюджету и команде