Электронное хранилище документов. Идеальное хранилище документов. Ключевые требования к структуре электронного архива

  • Семантика ,
  • Анализ и проектирование систем
  • Иногда очень хочется быстро найти нужный файл. С учетом того, что файлов - сотни тысяч, а ты не знаешь ни его названия, ни содержания, ни типа - ничего. Зато приблизительно знаешь категории. И хочется его быстро вычислить и сразу же отредактировать и записать.
    На сегодня удобных кросс-платформенных open-source файлопомоек с прямым доступом к файлам - НЕТ .
    Далее речь пойдет не о медиабиблиотеке и не о semaweb - а о простой и удобной системе управления громадной файлопомойкой с прямым доступом к файлам.

    1. ТЗ

    Британские ученные Практика показала, что даже в небольшой фирме на пару десятков пользователей может скопиться не один десяток (а то и сотни) тысяч файлов - самого разного содержания и формата. И найти в этом бардаке хозяйстве файл бывает настолько трудно, что проще сделать всё заново.
    Проблема поиска возникла сильно не сегодня (Чехов свидетель) - но пока не решена.
    Нюанс в том, что в данном случае «найти» - это не в терминах поисковиков или Проводника - а в терминах человеческих. Человек на знает слова, которые он ищет - он знает понятия. А с понятиями (семантикой) у поисковых машин и файломанагеров туго. Ибо нормальный пользователь не ищет “\\server\public\Входящие\Договоры\Клиенты\Рога и Копыта\Договор Рога и копыта с Ромашка на поставку.doc” - он ищет “Какой-то договор примерно в прошлом месяце с нашим любимым клиентом примерно на два лимона”. И найдет он его (если повезет) в “\\server\private\секретарша\Исходящие\ООО “Ромашка”\Коммерческие предложения\Копыто\Как они меня уже достали.xls”.
    В ситуации “они сами не знают, чего хочут” (Зощенко) надо дать человеку выбор (что и пытаются делать поисковики, но пока что безуспешно). Т.е. я не знаю тип документа - у меня перед глазами возможные типы. Я не помню точное название фирмы - у меня список фирм. И т.д. Поэтому это уже не поиск - а фильтр.
    Итак - допустим у меня есть 100500000 файлов (от прона до чертежей AutoCAD) - и я хочу быстро и удобно:
    1. «вычислить» (отфильтровать) файл по неким признакам, которых физически в самом файле нет,
    2. открыть (не скачать и открыть его копию - а открыть именно его),
    3. изменить - и записать (не закачать назад - а именно записать - ^S).
    Итого - нам нужна система, которая:
    • Работает
    • Кросс-платформенное (Windows, Linux, Mac OS)
    • Фильтры
    • Прямой доступ (открыть и записать)
    • Интеграция (интегрированность в окружение рабочего стола - как следствией п.4)
    • Многопользовательское
    • Internet (доступ из любой точки мира)
    • Open source

    2. Кто виноват

    Что мы имеем на сегодня:
    2.1. FS
    Речь идет о файлопомойке в виде развесистого дерева папок и файлов на локальной/удаленной файловой системе. Этот вариант имеет одно крупное достоинство и один крупный недостаток:
    • - Полное отсутствие фильтров.
    • + Встроенный кросс-платформенный прямой доступ к файлам.
    Конечно - иерархическое построение можно с натяжкой назвать “фильтром”. Но именно с натяжкой. Ибо если один человек положил файл в “\\server\public\ООО Ромашка\Договора\На поставку” - а другой ищет его в “\\server\public\Юротдел\Исходящие\Ромашка” - то это ни разу не соответствует ассоциативному мышлению человека. На само деле этот файл должен быть “Юротдел” И “Исходящие” И “Ромашка” И “Договор” - причем не в таком порядке, а одновременно. А вот одновременно текущие файломанагеры не обеспечат.
    2.2. Web
    Тысячи их. Отвечает всем требованиям, кроме двух:
    • - Прямой доступ к любым файлам (Гугледокс и MS Live - это хорошо - но что делать людям с AutoCAD и SmetaWizard?)
    • - Интеграция (как следствие)
    Т.е. частичный доступ
    2.3. All-in-one
    IBM Domino, MS SharePoint, MS Exchange. Это такое “вещь в себе”, которое пытается своими средствами порешать недостатки существующих технологий.
    • + Работает
    • + Фильтры
    • + Прямой доступ
    • + Многопользовательское
    • + Internet
    • - Не кросс-платформенное
    • - Не интегрировано
    • - Не open source
    2.4. Semantic FS
    Nepomuk, WinFS, ReFS etc. При всем уважении я их вживую работающими не видел, поэтому - не рассматривается наряду с другой экзотикой.

    3. Что делать

    Если кратко - вешаться использовать web-интерфейс для управления файлами и давать ссылку прямого доступа к файлам.
    С ссылками всё очень просто - особо не развернешься. Если исходить из кросс-платформенности - то вариантов (из тех, что не требуют специальных приседаний) аж 3: http://, ftp:// и file:// (больше венда нормально не понимает). При этом метаданные файлов можно организовать как угодно - от простых тегов до semaweb-наворотов. А вот с ссылками надо подумать.
    3.1. HTTP
    Только чтение. В смысле - дать ссылку http:// можно - и даже можно скачать, открыть и изменить. Но залить точно туда же - не получится. Комбинацией ^S по крайней мере. Из любого приложения под любой платформой.
    3.2. FTP
    Наверное можно каким-то образом скрестить веб-интерфейс со ссылками на файлы в ftp. Но гарантированно обеспечить целостность информации в базе метаданных и в ftp-хранилище довольно сложно - это два совершенно отдельных сервиса. Вмешаться в работу ftp-сервера - очень тяжело, а писать свой ftp-сервер…
    Отставить.
    3.3. file://
    Откровенный костыль. Т.е. можно как-то замапить удаленный ресурс на локальный по какому-то из интернет-протоколов - и даже будет работать. Но выглядит эта конструкция слишком феерично.
    3.4. WebDAV
    А вот тут всё очень интересно. Как такового - “стандартного” сервера WebDAV нет. Зато все распространенные ОС/DE поддерживают WebDAV (как клиенты) из коробки и множеством способов. При этом можно написать свою собственную WebDAV на стороне сервера (не веб-сервер - а только обработку http request) и вытворять буквально чудеса.
    Теоретически, конечно…
    Updated: после месяца секаса с Windows XP можно сказать, что WebDAV «искаропки» оно поддерживает чисто номинально .

    4. А при чем здесь Django?

    При том, что демонстрация этой идеи (Web UI + WebDAV) использует как раз Django (более точно - это небольшой комплект из Apache, mod_dav, Django и программки, сделанной на скорую руку специально для этой статьи). А дабы внимательный читатель внимательно дочитал - ссылка на демо - где-то в тексте:-)
    Демонстрируется, в частности, управление файлами через web (поле «comment» для файлов) - и прямой доступ к файлу прямо из веб-страницы.
    Хотелось, конечно, получить полное турбо от WebDAV - но внезапно оказалось, что из тысяч реализаций WebDAV-провайдера на python - оба (wsgidav и pywebdav) довольно сложно встроить в своё веб-приложение (если вообще возможно, т.к. это не WebDAV-провайдеры, а именно серверы). Пришлось читать буквы и начинать лепить свой велосипед. Букв довольно много, в одиночку дело идет медленно, поэтому приглашаю желающих к совместной разработке.
    Слайды .

    5. Комментарии

    Linux
    Konqueror с webdav:// работает отлично. Правда - только приложения KDE или же адаптированные к нему (libreoffice-kde) - по крайней мере при работе не в KDE. Т.е. интеграция тут только частичная (Пользователи LibreCAD, JuffEd и других не KDE приложений вынуждены сосать лапу.).
    Epiphany с dav:// - аналогично (s/KDE/GNOME/). Хотя гном с WebDAV работает похуже, чем кеды.
    Mac OS
    Не тестировалось
    Windows
    Т.к. на хабре применение обсценной лексики не приветствуется, то резюме будет краткое - всё очень плохо. Об “особенностях” взгляда Microsoft на WebDAV, HTTP и XML можно написать книгу.
    Но при определенном положении звезд кое-что кое-как кое-когда таки работает.
    Хотя, возможно, апачевый mod_dav не слишком совместим с Windows ;-)

    6. Резюме

    Вся эта стройная система костылей и подпорок работает, но не фонтан. В любой ОС (клиента). Т.е. на текущий момент ОС/DE не вполне готовы к полной интеграции веб-приложений с десктопом (так, чтобы прозрачно и всегда).
    Но жизнь на Марсе всё-таки есть! 25 сентября 2014 г. 12:52

    «It"s hard to look right

    To achieve you, baaaabeh»

    Из современной песни

    После автоматизации документооборота, неизменно возникает вопрос о хранении документов. Неужели автоматизация прошла даром и на последнем этапе документ придется распечатывать, чтобы обеспечить его архивное хранение?

    Сложности обеспечения сохранности электронных документов объясняются быстрым устареванием компьютерной техники, несовершенством информационных носителей и отсутствием успешных международной практик в этой области. Однако существуют документы, в которых описаны требования и рекомендации по хранению электронных документов.

    Требования к хранению электронных документов

    Документ должен быть читабельным на протяжении всего срока хранения . Из-за быстрого устаревания компьютерной техники и программного обеспечения возможна ситуация, когда документ созданный много лет назад будет невозможно прочитать, из-за отсутствия необходимого ПО или устройства.

    Необходимо перезаписывать документы для устранения проблемы устаревания носителей . Например уже сегодня сложно прочитать информацию с 3,5дюймовой дискеты, которые 10 лет назад были распространенным носителями информации. Решением этой проблемы законодатели видят периодическую перезапись информации с устаревающих носителей на более современные.

    Документ должен содержать атрибуты, позволяющие его идентифицировать . Имея гипотетическое хранилище электронных документов, необходимо хранить документы таким образом, чтоб не открывая каждый документ пользователь мог найти нужный. Тут помогут уникальные идентификаторы и различные методы группировки и сортировки.

    Документ должен быть доступен для чтения, независимо от появления новых версий редакторов и ридеров . Не зря на сегодняшний день все крупные разработчики ПО при разработке новых версий продукта поддерживают форматы и технологии предыдущих версий.

    Должна быть обеспечена возможность установки логических связей между документами, для правильной интерпретации текста документа . Например суть договора, в котором идет ссылка на приложение к договору, будет не понята в полной мере без прочтения приложения. Поэтому визуально и физически эти два документа должны быть связаны для быстрого и удобного поиска.

    Согласно другого документа - Рекомендации по комплектованию, учету и организации хранения электронных архивных документов в архивах организаций , организации должны разработать внутренние нормативные документы по комплектованию, учету, хранению и использованию электронных документов. Часть рекомендаций приведена в этом же документе, что существенно облегчает формирование внутренних нормативных документов.

    Прием документов в архив организации и информационные системы

    В рекомендациях говорится о том, что «технические аспекты приема электронных документов в архив организации, операции учета, отбора, обеспечения сохранности и хранения, конвертирования в новые форматы и миграции на новые носители устанавливаются в специальных инструкциях, разрабатываемых в организации », а так же что «архив организации осуществляет администрирование информационных систем организации в части соблюдения требований к хранению созданных и/или включенных в них электронных документов ».

    Также определено, что в архив организации должны передаваться документы со сроком хранения более 10 лет. Документы со сроком хранения менее 10 лет должны храниться в информационной системе организации, в которой были созданы. «При этом они должны быть систематизированы в соответствии с существующей на предприятии номенклатурой дел и проиндексированы в соответствии с правилами для дел бумажных документов ».

    Требования к документам, передаваемым в электронный архив

    Не менее важны вопросы по формату передаваемых документов в архив:

    ● При сдаче документов в архив их необходимо сконвертировать в формат архивного хранения, которым назван формат - PDF/A-1.

    ● Учетной единицей электронных документов в архиве организации является единица хранения – контейнер электронного документа. Контейнер электронного документа представляет собой zip-архив, который содержит сам документ и его метаданные, включая ЭП.

    ● Систематизация документов в дела и распределение в контейнеры проводится в подразделении, в котором ведется дело.

    ● Контейнеры на хранение могут передаваться по сети или на обособленном носителе информации однократной записи в двух экземплярах –основной и рабочий.

    ● Учету подлежат все хранящиеся в архиве организации электронные документы и описи электронных документов, дел.

    ● Учет производится путем присвоения единицам хранения электронных документов учетных номеров, которые являются составной частью их архивного шифра, понятно, что если документы передаются обособленных носителях, то шифр необходимо проставлять на футляре носителя. При хранении электронного документа в информационной системе шифр включается в метаданные контейнера документа

    ● Архивный шифр единицы хранения электронных документов включает те же элементы, что и архивный шифр хранения бумажных документов и дополнительно указывается отметка о статусе экземпляра электронных документов: (осн.) –основной, (раб.) – рабочий.

    Требования к сохранности электронных документов

    Описаны процедуры для обеспечения сохранности ЭД и требования для хранения боксов с обособленными носителями информации: «Должна проводиться проверка наличия и состояния документа при сдаче в архив, раз в три года и при перемещении архива в другое место, при смене руководителя архива, при переносе документов на другие носители и перед передачей документов в государственный архив. В документе описаны правила и цели проведения проверки ».

    Выдача документов

    Для выдачи электронного документа из архива документ копируется, а его достоверность должна подтверждаться отсоединенной ЭП. Факт выдачи фиксируется в журнале.

    Архив организации может предоставлять электронные документы по локальной сети организации. В этом случае ведется электронный журнал учета выдачи электронных документов из архива, в котором фиксируется: дата выдачи, фамилия, инициалы запросившего документ сотрудника, название структурного подразделения, заголовок и учетный номер выданного документа.

    Большинство из нас привыкли работать с документами в электронном виде, и вышеперечисленные факты еще на шаг приближают такой режим работы к законодательно правильному. И хочется верить, что совсем скоро мы будем вести полностью автоматизированный документооборот.

    Одной из главных задач современного промышленного предприятия является повышение эффективности производственных процессов и снижение издержек производства. Важным фактором оптимизации производственных процессов является своевременное обеспечение сотрудников технических и производственных подразделений необходимыми техническими документами и данными.

    Решение

    Для решения задачи оперативного документационного обеспечения процессов производства корпорация ЭЛАР предлагает комплексное решение «Единое хранилище документов и данных промышленных предприятий», состоящее из четырех компонентов:

    • Единое хранилище для документов и данных
    • Модуль автоматизации процессов разработки, согласования и внесения изменений в техническую документацию
    • Интеграционная платформа, объединяющая пространства различных информационных систем предприятия в единую информационную среду
    • Услуги по наполнению хранилища техническими документами и данными

    Структура решения

    Для реализации решения используется единый программный комплекс, который обеспечивает хранение, оперативный доступ и защиту информационного массива документов и данных предприятия.

    Все компоненты решения соответствуют требованиям международных и государственных нормативных стандартов в части работы с технической документацией.

    Этапы внедрения

    Система управления единого электронного хранилища документов и данных.

    Внедрение ядра системы единого хранилища документов и данных – программной платформы, обеспечивающей надежное централизованное хранение электронных документов , поиск и оперативный доступ к документам и данным. В системе создаются разделы хранилища и разрабатываются индексные карты для различных типов документации – конструкторской, технологической, нормативно-технической и справочной. Реализуется древовидная структура хранения конструкторских и технологических документов в соответствии со структурой изделий. Обеспечивается поддержка версионности хранения технических документов, и осуществляется привязка извещений об изменениях к соответствующим версиям документа. В систему поиска подключаются классификаторы деталей и сборочных единиц. Конфигурируется кодификатор присвоения децимальных номеров документов в соответствии с ЕСКД.


    Наполнение хранилища техническими документами и данными

    Осуществляется систематизация и индексирование массива электронных технических документов, заполняются индексные карты, после чего документы загружаются в систему хранилища. Для наполнения ресурса хранилища «бумажными» документами проводится экспертиза фондов, осуществляется сканирование, верификация, затем проводится индексирование и загрузка в систему хранилища отсканированных образов (электронных копий) документов. При необходимости обработки текущих поступлений на предприятии организуются специализированные центры обработки документации.


    Внедрение модуля автоматизации процессов технического документооборота

    Проводится обследование и оптимизация текущих процессов технического документооборота предприятия, по результатам обследования разрабатываются маршруты движения документов, функционал автоматизированных рабочих мест, назначаются ответственные роли, и выделяются группы пользователей. После чего, разрабатываются регламенты организации процессов разработки, согласования и внесения изменений в техническую документацию в информационной системе. Создаются и согласовываются формы извещений об изменениях по ГОСТ 2.503-90, и, если необходимо, реализуются методы согласования документов с помощью средств электронной подписи.


    Внедрение модуля интеграционной платформы хранилища

    Посредством модуля интеграционной платформы осуществляется интеграция управляющего программного комплекса хранилища с существующими информационными средами. Реализуются функции поиска и работы с документами в привычных для пользователей интерфейсах. Внедряются модули интеграции с CAD-системами, обеспечивающие работу с системой единого хранилища непосредственно из интерфейса CAD-системы. Кроме того, для тех рабочих станций, на которых не установлены лицензии CAD реализуется возможность просмотра документов через встроенный в систему просмотрщик.

    Преимущества решения

    • Повышение эффективности производственных процессов за счет организации поиска и предоставления оперативного доступа к массиву технической документации предприятия
    • Увеличение производительности работы технических и производственных подразделений за счет централизованной среды управления техническими документами и данными об изделиях
    • Сокращение времени и трудозатрат на разработку, согласование и внесение изменений в техническую документацию посредством автоматизации процессов технического документооборота
    • Гарантия безопасного хранения электронных документов и данных
    • Создание единой информационной среды предприятия с помощью интеграционной платформы

    Внедрение решения «Единое хранилище документов и данных промышленных предприятий» позволит оптимизировать производственные процессы и упростить сертификацию предприятия на соответствие международным стандартам менеджмента качества ISO серии 9000.

    Для получения более подробной информации Вы можете позвонить по бесплатному номеру телефона

    Наши специалисты обязательно свяжутся с Вами и ответят на все интересующие вопросы!

    Это система хранения любой значимой документации (бухгалтерской, кадровой, технической и т.п.), позволяющая значительно оптимизировать и автоматизировать бизнес-процессы современного предприятия.

    Только представьте — все Ваши бумажные документы отсканированы и помещены в файловую систему, доступ к которой предоставляется постоянно. Это значит, что Ваши сотрудники смогут найти, обработать или передать коллегам необходимые документы за несколько минут не отходя от рабочего места.

    Организация электронного архива помогает воплотить эти мечты в реальность, а благодаря «безбумажной» форме хранения в Вашем офисе еще и освобождается много места. Хранение данных не традиционным, бумажным способом, а с использованием современных информационных технологий позволит Вам максимально оптимизировать рабочий процесс.

    Организация электронного архива на предприятии обеспечит:

    1. Удобный и быстрый поиск нужной документации;
    2. Упорядоченное безопасное хранение;
    3. Коллективный доступ к работе с документами;
    4. Ограничение несанкционированного доступа;
    5. Высвобождение офисных площадей от накопившихся бумаг;
    6. Защиту документации от безвозвратной утери или повреждения.

    Основными этапами создания электронного архива документов являются:

    1. Подготовка к сканированию и перевод в электронный вид;
    2. Настройка системы в соответствии с бизнес-процессами организации;
    3. Разработка регламента использования системы;
    4. Наладка процесса пополнения архива.

    6 причин необходимости создания электронного архива:

    1. Удобство . Использование электронного архива документов обеспечивает эффективный и простой доступ и управление служебной информацией. Доступ к документам в многопользовательском режиме в электронном вид - не проблема.
    2. Скорость . Внедрение электронного архива решает проблему оптимизации документооборота. Главное предназначение — сократить время поиска необходимых бумаг. В большинстве случаев необходимые документы удается найти в автоматическом режиме поиска.
    3. Сохранность . Электронный архив решает проблему утери важных документов по неосторожности, при их передаче, транспортировке, либо по причине воздействия окружающей среды (пожар, наводнение и т.п.). Распределенные хранилища электронных данных с налаженными процедурами резервирования надежно защищают электронные документы от потери.
    4. Безопасность . Возможность обеспечить контроль доступа к информации в электронном архиве, исключается потеря важных документов и их несанкционированное изменение. Механизмы ограничения прав доступа, протоколирование действий пользователей и автоматическое резервное копирование позволяют обеспечить высокий уровень информационной безопасности.
    5. Логическая целостность . Продуманная структура электронного архива документов позволит систематизировать документацию, распределив ее относительно вида и срока хранения, а также структурировав данные согласно любым другим критериям.
    6. Масштабируемость . Разработка стандартов классификации документов и введение регламентаций позволит в дальнейшем выработать подход к созданию единой базы документации компании любого уровня. Масштабируемое решение до отраслевого уровня.

    Электронный архив в контексте предприятия - это система ECM

    Электронный архив относится к классу систем управления корпоративным контентом (Enterprise Content Management). В общих чертах он представляет собой систему хранения электронных документов, обеспечивающую надежность хранения, конфиденциальность и разграничение прав доступа, отслеживание истории изменений, удобство и скорость поиска.

    Электронные архивы призваны упорядочить работу с неструктурированной электронной информацией предприятия: текстовыми данными, мультимедиа, графикой и т. д. Чаще всего объектами хранения становятся подписанные контракты, первичная финансовая документация, техническая и проектная документация.

    В основном документы, с которыми работают сотрудники, являются статичными, т. е. окончательно сформированными и неизменными - такая документация может храниться в электронных архивах и быть доступной для чтения. Для систематизации документов разрабатывается их иерархия, на каждый заводится так называемая карточка, содержащая перечень атрибутов, однозначно идентифицирующих документ.

    Эволюционно к вопросу внедрения электронного архива многие приходят, вдоволь наигравшись с сетевыми папками общего пользования, но еще не будучи готовыми к внедрению сложных систем документооборота.

    Электронный архив как полноценная ECM-система включает следующие базовые компоненты:

    • управление документами (check-in/check-out, поддержка версионности, безопасность, управление сервисами);
    • имиджинг документов (оцифровка, трансформация, представление в разных форматах бумажных документов);
    • система Workflow для поддержки бизнес-процессов, распределение контента, контроль исполнения задач, аудит действий и изменений;
    • управление Web-контентом;
    • поддержка командной работы над электронными документами.
    Внедрение подобных систем на предприятии - чрезвычайно сложный, длительный и дорогостоящий процесс. При принятии решения о целесообразности такого внедрения в современный период мирового экономического кризиса основными принципами должны стать поэтапность и быстрота внедрения с получением первых результатов при разумных финансовых вложениях.

    Определяя подходы к внедрению ECM по возможности необходимо:
    • максимально формализовать требования, написать техническое задание
    • остановить свой выбор на системах, предлагающих готовые решения и позволяющих быстро создать рабочий прототип;
    • выбрать в партнеры внедренцев, имеющих опыт реализации подобных проектов и способных исследовать и определить специфику бизнес-процессов компании;
    • поставить условие получения первых результатов в течение месяца, максимум двух;
    • распределить усилия и финансовые затраты равномерно по проекту.

    Теперь, когда мы в общих чертах определили что из себя представляет электронный архив, мы можем с уверенностью утверждать, что первой и наиболее важной составной частью процесса создания электронного архива является процесс сканирования оригиналов.

    Правильно организовать данный процесс, подобрать необходимое оборудование и программное обеспечение, произвести его установку и настройку, определить регламент технического обслуживания и поддержки получившейся системы ввода документов — все это составные части, определяющие будет ли проект создания электронного архива успешным.

    Подробнее о процессе сканирования в Электронный архив мы расскажем в следующих статьях.

    2014 ПИРИТ, Департамент документных сканеров.
    Статья написана специально для размещения на сайте



    Понравилась статья? Поделитесь ей
    Наверх