Одно окно
Галоўная/Проекты/Інфармацыйна-тэхналагічная сістэма рэтраканверсіі

Інфармацыйна-тэхналагічная сістэма рэтраканверсіі

Аўтаматызацыя бібліятэчнай дзейнасці немагчымая без наяўнасці такога важнага элементу, як электронны каталог, які з'яўляецца ядром бібліятэчнай тэхналогіі. У сувязі з уводам у эксплуатацыю новага будынку Нацыянальнай бібліятэкі Беларусі і ўвядзення аўтаматызаванай бібліятэчнай інфармацыйнай сістэмы (АБІС) паўстала пытанне аб рэтраканверсіі карткавых каталогаў.

Рэтраспектыўная канверсія - пераклад ужо наяўнай бібліяграфічнай інфармацыі на традыцыйных носьбітах (карткавых каталогах) у больш зручную для выкарыстання машыначытэльную форму. 

З прычыны спецыфікі прадметнай вобласці, задача рэтраканверсіі, запатрабавала ад спецыялістаў НП РУП «Агат-Сістэм» распрацоўкі унікальнай прамысловай Інфармацыйна-тэхналагічнай сістэмы рэтраканверсіі (ІТСР), у якую ўваходзяць набор тэхнічных сродкаў і праграмных прадуктаў, запатрабавала выканання цэлага комплексу мерапрыемстваў па арганізацыі працоўных месцаў і навучання персаналу. 

У рамках задання неабходна апрацаваць ~ 3,5 млн. картак шасці розных карткавых каталогаў, тэрмін выканання задання - 2 гады (лістапад 2005 г. - кастрычнік 2007). 

Каранёвым момантам у працэсе рэтраканверсіі з'яўляецца прадстаўленне інфармацыі з каталожнай карткі ў выглядзе тэксту і наступная апрацоўка атрыманага тэксту з мэтай выдзялення элементаў бібліяграфічнага апісання і фарміравання электронных запісаў у MARC-фармаце. Увогуле работа па рэтраканверсіі ўключае:

  • Сканаванне каталожных картак;

  • Распазнанне («расшыфроўка») графічных вобразаў картак спецыяльным праграмным забеспячэннем з мэтай атрымання тэкстаў;

  • Апрацоўка тэкстаў каталожных картак, вылучэнне асобных элементаў бібліяграфічнага апісання;

  • Фарміраванне запісаў у MARC-фармаце. 

Аперацыю атрымання тэксту з карткі можна лічыць тыповай, бо для гэтага існуюць спецыяльныя пакеты праграм, якія выкарыстоўваюць метад распазнавання вобразаў і пераўтварэння (або расшыфроўкi) тэксту з графічнай крыніцы. Таму распрацаваная ў НП РУП «Агат-Сістэм» IТСР прадугледжвае апрацоўку інфармацыі ўжо распазнаных пасля сканавання каталожных картак. Пабудавана сістэма на базе СКБД Oracle з выкарыстаннем архітэктуры "кліент-сервер", што забяспечвае захоўванне і апрацоўку значных аб'ёмаў інфармацыі, інтэнсіўнае сумеснае выкарыстанне рэсурсаў карыстальнікамі спецыялізаваных рабочых месцаў. 

ІТСР складаецца з:

  • Базы даных (БД) для захоўвання і назапашвання інфармацыі;

  • Комплексу праграм, прызначаных для суправаджэння базы даных, кантролю завяршэння тэхналагічных аперацый, а таксама адміністравання сістэмы і ўліку работы персаналу;

  • Некалькіх відаў аўтаматызаваных рабочых месцаў (АРМ), функцыянальна розных ў залежнасці ад выконваемых работаў на адпаведнай стадыі тэхналагічнага працэсу: АРМ карэкціроўкі (нармалізацыі) тэксту. 

 

Якое б учыненае праграмнае забеспячэнне не выкарыстоўвалася для распазнання, сустракаюцца сімвалы, якія распазнаюцца няўпэўнена (ці не распазнаюцца увогуле, бо выкананы рукапісным спосабам, або фізічныя характарыстыкі каталожных карткі не дазволілі атрымаць пасля сканавання здавальняючы вобраз). Таму ўсе тэксты, атрыманыя пасля праграмнай «расшыфроўкі» павінны праходзіць стадыю ручной апрацоўкі. Сутнасць гэтай апрацоўкі заключаецца ў карэкціроўцы тэкстаў аператарамі з дапамогай спецыяльнага праграмнага забеспячэння

  • АРМ АТК тэксту;

  • АРМ маркіроўкі тэксту;

  • АРМ АТК маркіроўкі тэксту;

  • АРМ АТК прызначэнняў.  

Выконваецца праверка аднясення картак рознага віду ў адпаведныя інфармацыйныя патокі.

АРМ адміністратара сістэмы; 

Комплексу праграм для аўтаматызаванай апрацоўкі тэкстаў каталожных картак з мэтай вылучэння асобных элементаў бібліяграфічнага апісання, адпаведных палям Беларускага камунікатыўнага фармату BELMARC, распрацаванага на базе UNIMARC. 

Дадзены комплекс праграмаў уключаны ў склад АРМ маркіроўкі, істотна зніжае працаёмкасць дадзенай тэхналагічнай аперацыі, бо дазваляе аўтаматычна вызначыць і вылучыць у тэкстах каталожных картак да 64 палёў MARC-фармату. 

Комплексу праграм для кантролю палёў бібліяграфічных апісанняў і выгрузкі даных у выхадныя файлы для інфармацыйнага абмену. 

Выгрузка інфармацыі з БД IТСР ажыццяўляецца ў файлы, структураваныя ў адпаведнасці з ДАСТ 7.14-98 (ISO 2709-96). 

Праграмы кантролю бібліяграфічных запісаў. 

Дадзены модуль не мае інтэрфейсу з базай даных IТСР і прызначаны для правядзення выбарковага або суцэльнага кантролю выходных файлаў з мэтай прыёмкі спецыялістамі заказчыка.

Асаблівасці апрацоўкі інфармацыі, рэалізаваныя ў сістэме.

Асноўная асаблівасць апрацоўкі інфармацыі ў IТСР - верыфікацыя, г. зн. праверка правільнасці выканання асноўных аперацый (карэкціроўка і маркіроўка тэксту). Рэжым верыфікацыі складаецца ў выкананні двухразовай апрацоўкі інфармацыі адной каталожных карткi двума выканаўцамі і наступнага аўтаматычнага вызначэння разузгаднення ў даных. Прыняцце рашэння для ліквідацыі выяўленых памылак ажыццяўляецца аператарамі АРМ АТК.

У сувязі з асаблівымі патрабаваннямі стандарту на складанне шматузроўневых бібліяграфічных апісанняў, у першую чаргу на шматтомныя дакументы, а таксама серыяльныя і іншыя няспынныя рэсурсы, быў распрацаваны спецыяльны карыстальнiцкі і праграмны інтэрфейс. Такім чынам, IТСР дазваляе вырабляць «зліццё» даных некалькіх каталожных картак або «разбіццё» даных адной карткі на лагічныя блокі і наступную іх апрацоўку, прычым з магчымасцю прывязвання інвентарных нумароў адзінак захоўвання да адпаведных тамоў.

Варта адзначыць закладзеныя ў сістэме прынцыпы размеркавання інфармацыі пры апрацоўцы: пры карэкціроўцы тэксту інфармацыя на рабочыя месцы паступае ў выпадковым парадку, а на самой адказнай аперацыі - маркіроўцы тэксту (бібліяграфічнай разметцы) - інфармацыя паступае на рабочыя месцы ў выглядзе паслядоўных, абмежаваных па колькасці картак блокаў даных, адпаведных фізічнаму размяшчэнню ў скрынях захоўвання. Такія тэхналагічныя прынцыпы апрацоўкі гарантуюць магчымасць выгрузкі ў выходны файл толькі завершаных блокаў даных, кратных каталожнай скрыне. 

Тэхналагічныя прынцыпы, закладзеныя ў IТСР, накіраваны, перш за ўсё, на забеспячэнне жорсткіх патрабаванняў да якасці ствараемых бібліяграфічных запісаў. Пры кантролі 5% выбаркі бібліяграфічных запісаў, выгружаемых ў выходны файл, сістэма забяспечвае не больш за адну памылку ў маркеры (MARC-поле) на 10 запісаў.


Вяртанне да спiсу