11 Ocak 2011 Salı

Sertifika Programı I - Dijitalleştirme Eğitimi


Sertifika Programı I - Dijitalleştirme Eğitimi

Küçük bellek kurumları için dijital arşivler
Genel tanım:
Bu derste halk kütüphanesi ve yerel müze gibi küçük bir bellek kurumunda dijitalleştirme işlemlerinin nasıl düzenleneceğini ve yürütüleceğini öğreneceksiniz
Ders, kültürel miras nesnelerinin nasıl dijitalleştirileceğini, bunların online ortamda sunulmak üzere nasıl hazırlanacağını ve metadata ile nasıl tanımlanacaklarını gösterir. Gerekli kuramsal bilginin yanı sıra küçük kurumların yüksek kaliteli dijital içerik oluşturmalarını ve Europeana gibi hizmetlere bu içerikleri vermelerini sağlayacak pratik açıklamalar da içerir (Europeana).
Ders aşağıda listelenen 9 konuya ayrılmıştır. Bu konular 24 derse bölünmüş ve ek kaynaklarla desteklenmiştir.

Bu dersi alanların dijital ortama aktarmak istedikleri kültürel miras nesnelerini dikkatle ele almak için gerekli bilgilerin yanı sıra, temel bilgisayar becerilerine ve Internet hakkında bilgiye sahibi olmaları gerekmektedir.


Dijitalleştirmeye giriş
Bu konu kültürel mirasın dijitalleştirilmesi süreci ile ilgili temel kavramları açıklar.
Bu bölümde dijitalleştirmenin neden bu kadar önemli olduğunu ve koruma sürecinde küçük bellek kurumlarının rolünün ne olduğunu öğreneceksiniz. İnternet’te kültürel miras objelerinin dijital versiyonunun oluşturulması ve yayınlanması amacıyla ne yapılması gerektiği konusunda fikir vermek için temel dijitalleştirme iş süreçleri de sunulacaktır.



İçindekiler

  1. Giriş
  2. Henry III Fine Rolls Projesi
  3. Discover Domesday
  4. Avustralya Gazeteleri Dijitalleştirme Programı
  5. Büyük Savaş Arşivi
  6. Dersin özeti

Henry III Fine Rolls Projesi

Henry III Fine Rolls Project Milli Arşivler ve Londra King's College tarafından geliştirilmiştir.
"Fine rolls (Hassas rulolar), İngiliz kraliyet baş mahkemesi tarafından derlenmiş, hayatta kalmış en eski rulolardır. 1199 yılından, birbirini takip eden sırada hayatta kalmıştır ve Kew’deki Milli Arşivler’de saklanmaktadır. Henry III’ün hüküm sürdüğü (1216-1272) yıllara ait elli altı rulo mevcuttur, parşömen üzerine Latince yazılmıştır [...] İngiltere tarihi açısından Henry’in hüküm sürdüğü erken dönemde Magna Carta’nın kurulması ile parlamenter devlet arasındaki döneme ait hayati değere sahip bir kaynaktır." [kaynak]
Figure 1: Fine Rolls of Henry III'e ait görüntülerden biri [kaynak].
Büyük hazinelerin özelliklerinden biri sadece çok sınırlı sayıdaki insanlar tarafından erişilebilir olmalarıdır. Hassas Ruloların dijital ortama aktarılmasından önce, erişilebilecek uygun edisyonu olmamasından dolayı tarihçiler açısından rulolar hiç işe yaramaz durumdaydı. Hassas Ruloların dijital ortama aktarılması sayesinde artık herkese anlaşılır bir şekilde ve ücretsiz olarak açıktır. Hassas Ruloların erişebilirliği aşağıdaki araç ve işlemler kullanılarak gerçekleşmiştir:
  • rulolar modern İngilizceye tercüme edilmiştir,
  • tarama özelliği oluşturularak kullanıcıların kişi, yer ve konu taraması yapmaları sağlanmıştır,
  • orijinal Latince içerik üzerinde çalışma olanağı sunmak için taranmış görüntüler sunulmuştur,
  • uygun indeksler içeren çeviriler bir kitaplar seti olarak yayımlanmıştır  [kaynak].
Daha ayrıntılı bilgi için http://www.finerollshenry3.org.uk sitesine bakınız.

Discover Domesday

Discover Domesday

Discover Domesday İngiliz Milli Arşivi'nin bir projesidir.
"Domesday en meşhur ve en eski hayatta kalmış kamu kayıtlarıdır. Kralın ve baş kiracılarının elinde bulunan bütün toprakların ayrıntılı araştırması ve değerininin yanı sıra 11'inci yüz yıl İngiltere'sinde toprakla ilgili bütün kaynakları içerir. Araştırma büyük bir girişimdi ve araştırmanın kaydı olan Domesday Kitabı önemli bir başarıydı. İngiltere’de 19'uncu yüz yıl nüfus sayımlarına kadar buna benzer bir şey yoktur." [kaynak]
Figure 1: Domesday oyunu [kaynak]
Domesday kitabı İngiltere'nin favori hazinesi olarak seçilmiş ama onu Ulusal Arşiv Müzesinde sergilenirken nüfusun yüzde birinden azı görmüştür. Milli Arşiv bu kitabı online olarak sunarak okul çocukları, şecere meraklıları ve uzman araştırmacılar dahil daha çok kişinin ilgisini çekeceğini ummuştur. Domesday kitabı şimdi online olarak ücretsiz sunulmaktadır, kullanıcılar verilen başlıklarla kolayca tarayabilir ve modern çevirisini okuyabilirler. Buna ek olarak okul çocukları için oyun ve sınav dahil, çeşitli eğitim materyalleri de geliştirilmiştir [kaynak].

Avustralya Gazeteleri Dijitalleştirme Programı

Avustralya Gazeteleri Dijitalleştirme Programı

Australian Newspapers Digitisation Program Avustralya Milli Kütüphanesinin bir projesidir.
"[...] eski dönem gazeteler Resmi Gazete olarak da hizmet verdiler ve Avustalya’ya mahkum gemileri ile getirilen bütün mahkumları, getirildikleri geminin adını, hapishane kolonileri arasındaki hareketlerini, Serbest Bırakılma belgeleri, Af Belgeleri, Özgürlük Belgeleri ve Sınırsız Af belgelerini de listelemekteydiler. Mahkûmlar cezalarını çektikten veya Sınırsız Af belgesi aldıktan sonra kolonilerden ayrılabilirlerdi. Çıkanlar Sydney Gazetesinin ‘Niyet Bildirim’ köşesinde duyurulurdu. Eski Avustralya gazetelerinin ‘Sevkiyat Haberleri’ köşeleri şecere araştırmacıları için mahkum ve diğer insanların hareketleri hakkında eşsiz bilgiler sağlamaktadır. İngilizlerin Avustralya’ya yerleşmesi ve o zamanki yerlilere yapılan muameleler de gazeteler tarafından iyi kaydedilmiştir. Bütün bunlar Avustralya gazetelerini araştırmacılar için zengin bir kaynak yapan faktörlerdir." [kaynak]
source: Canbera Times, 26.07.1928, page 6
Figure 1: Canbera Times'dan bir çizim, 26.07.1928, sayfa 6.
Avustralya Gazetelerini Dijitalleştirme Programının (ANDP)  temel hedefleri arasında programın yaratıcıları şunlardan bahsetmektedir:
  • Avustralya gazetelerine erişimi artırma,
  • 1803’den 1954 sonuna kadar yayınlanmış Avustralya gazetelerine ücretsiz online erişim sağlayacak milli bir hizmet oluşturmak.
Dijitalleştirmenin sonuçları online olarak mevcuttur, materyallere ücretsiz erişim ve tam metin tarama olanağı sunar. [kaynak]
Eski gazetelerin genellikle saf kalitede asitli kağıda basıldığından bahsetmek gerekir, bu kağıt oldukça çabuk bozulmaktadır. Uzun dönemli düşünüldüğünde, bu materyalleri korumanın tek yolu dijital ortama aktarıp mikrofilme almaktır.

Büyük Savaş Arşivi

Büyük Savaş Arşivi

The Great War Archive  Oxford Üniversitesi tarafından geliştirilen Oxford’un Birinci Dünya Savaşı Şiir Arşivi’nin bir yan projesidir.
Birinci Dünya Savaşı Şiir Dijital Arşivi Oxford Üniversitesinde yürütülen bir projeydi, özellikle Batı Cephesinin İngiliz şairleri üzerinde yoğunlaşmaktaydı, ama arşiv aynı zamanda şiir bağlamında zengin tarihi materyal de içermekteydi. Bu projenin bir parçası olarak Oxford Üniversitesi, Great War Archive (GWA) adıyla Büyük Savaş Arşivi girişimini başlattı. GWA, aile fotoğrafları, günlükler, mektuplar, savaş zamanından kalma eserler gibi halkın elinde bulunan materyalleri bir araya toplamayı hedeflemekdeydi. Proje çalışanları (çeşitli iletişim kanallarını kullanarak) halkın materyalleri getirmelerini ve ailelerinin yaşadıkları ile ilgili kuşaklardır anlatılan hikayeleri kaydetmelerini istedi. Projenin yürütüldüğü 16 hafta boyunca 6500 malzeme toplandı. “Projede çeşitli savaş alanlarından askerlere ait benzersiz, yayınlanmamış 42 adet günlük, 63 hatıra, 255 yayınlanmamış mektup, 700’den fazla fotoğraf, çeşitli kitapçık, yerel asker toplama posterleri, nadir nesnelerin görüntüleri (orijinal meçhul asker mezar taşı tasarımı gibi) ile benzeri materyal toplandı" [kaynak].
Field postcard
Figure 4: Savaş alanından bir kartpostal, [kaynak]
Bu tür bir koleksiyonun değeri nedir? “Tanıtımından itibaren GWA’nin etkisi, İngiltere, Kanada ve Avustralya’dan pek çok askeri tarihçi ve milli müzelerin proje sırasında ve sonrasında bizimle iletişime geçmesi ile kanıtlanmaktadır. Dünya çapında basında yer almış ve büyük bir ilgi uyandırmıştır. İlk kullanım istatistikleri, GWA’nın Birinci Dünya Savaşı Şiir Arşivine, daha bilimsel olan Savaş Şiiri koleksiyonundan daha fazla kullanıcı çektiğini göstermektedir. Öğretmenler Birinci Dünya Savaşı ile ilgili çeşitli konularda derslerinde göstermek üzere düzenli olarak materyal indirmekte, konuya canlılık getirmekte ve öğrencilerin ilgisini çekmektedirler. Şimdiye kadar görünmemiş bu materyal akademik kurumlarda çalışan araştırmacılar, şecere çalışanları, yerel tarihçiler ve sadece kendi ilgilerini çektiği için bu konuyla ilgilenenler için yeni araştırma yolları sağlamaktadır. Sonuç olarak, kendi aileleri ve toplulukları içinde tarihlerinin izini süren kamuoyu tarafından projeye düzenli olarak başvurulmaktadır." [kaynak].

Dersin özeti

Dijital medya daha fazlasını görmeye, daha fazlasını öğrenmeye ve daha fazlasını yapmaya izin verir. Dijitalleştirme olmadan Avustralya Resmi Gazetesinin sayılarını ışık hızında taramak mümkün olmayacaktı. Müze sergilerinin dijital görüntüleri kullanıcıların o müzeye gidip bütün koleksiyonu görüp görmeme konusunda karar vermelerini sağlar. Dijital medya, yeni birşeyler yaratmak için kolayca kopyalayıp, karıştırıp ve birleştirilebilecek araç ve materyaller sağlayarak modern sanatın gelişmesine yardımcı olur. Kütüphaneler, kitapları tarayarak bunları bilgisayar üzerinden kütüphane okuma odalarında öğrencilere sunabilirler. Bu sayede artık kütüphaneler mevcut kopyalarla sınırlı değildir. Dijitalleştirme, uygun donanım eksikliği veya bozulma nedeniyle ileride erişilemeyecek olan kaynaklara erişim için bir yol olabilir, örneğin 19'uncu yüz yıl gazeteleri, eski film teypleri veya vinil gramafon kayıtları gibi.
Diğer pek çok neden yanında dijitalleştirme:
  1. bilinmeyen veya az kullanılan koleksiyonlara daha iyi erişim sağlar,
  2. görsel bir koleksiyon için daha iyi bir tarama ve erişim olanakları sunar,
  3. gelişmiş indeksleme veya bazı dijital görsel iyileştirmeler sayesinde orijinal çalışmaları daha iyi anlamayı sağlar,
  4. eğitim ve öğrenimde kullanmaya uygun kaynaklar yaratır,
  5. halkın kültürel mirası tanıma, öğrenme ve anlayışını geliştirir,
  6. dijital formatta gelecek için koleksiyonları koruma olanağı verir.
Bu 6 madde bütün olası gerekçeleri kapsamaz fakat kültürel mirasın korunmasında dijitalleştirmenin rolü hakkında pek çok şeyler söyler.
Bilgiye daha kolay erişim ve kültürel mirasın korunması olanağı dijitalleştirmenin sağladığı en büyük yararlardır. Bu ikisi küçük bellek kurumlarının misyonunun özünü oluşturur.

Kaynakça

  • "Henry III Fine Rolls Project", The National Archives and King's College London [link]
  • "Discover Domesday", The National Archive, UK [link]
  • "Australian Newspapers Digitisation Program", Australian National Library [link]
  • "Great War Archive", University of Oxford, [link]

İçindekiler

  1. Giriş - dijitalleştirme neden zordur?
  2. Dijitalleştirme iş akışı
  3. Dijitalleştirme için nesnelerin seçimi
  4. Dijitalleştirme dış hizmet alımı ne zaman bir çözümdür?
  5. Nesne metadatasını hazırlama
  6. Tarama ekipmanı
  7. Grafik ileri işleme
  8. Metni alma
  9. Taranmış nesnenin web'de sunum versiyonu
  10. Nesnenin web'de yayınlanması
  11. Dersin özeti - Bütün bunlar nasıl düzenlenir?

1.GİRİŞ - DİJİTALLEŞTİRME NEDEN ZORDUR?

Dijitalleştirmenin en genel tanımlarından biri, analog nesnenin dijital biçime aktarılmasıdır, bu kulağa çok kestirme bir tanım olarak gelmektedir. Bu derste dijitalleştirmeyle ilgili kavramlar hakkında daha fazla bilgi edinecek ve kendi kurumunuzda dijitalleştirme iş akışı düzenlemenin olası yollarını öğreneceksiniz. "Kültürel miras alanında dijitalleştirme çalışmalarının mantığı nedir?" konusunda çeşitli dijitalleştirme projelerinden örnekler gördünüz. Bu küçük örneklem farklı dijitalleştirmenin nasıl olabileceğini gösterme açısından size yardımcı olmalı; çizimler, kitaplar, el yazmaları, vinil müzik kayıtları. Her kaynak türü farklı muamele ve özel araçlar kullanmayı ve ayrıca bu araçları doğru kullanmak için ek bilgileri gerektirir. İlk adımı yerine getirdikten sonra nesneyi online olarak sunmak için doğru yolu seçmeniz gerekecek. Şu anda kulağa karmakşık bir süreç gibi gelebilir. Korkmayın, dersler ilerledikçe bahsedilen şeylerin hepsinin zor olmadığını, özel durumlarda bunlardan bazılarının atlanabileceğini göreceksiniz.
Dijitalleştirme sırasında neyin önemli olduğunu gösteren birkaç örnekle başlayalım.
Örnek 1 - Düşük çözünürlük
Şekil 1: Çok düşük çözünürlük metni okunmaz hale getirir
Ana dili Latince olan birisi için bile bu görüntüden yazıyı okumak sorun olabilir. Neyin yanlış yapıldığını açıklamak için görüntü çözünürlüğü hakkında daha fazla bilgiye ihtiyacınız olacak. Görsel çözünürlük, görüntünün sahip olduğu ayrıntı düzeyini tanımlar, yüksek çözünürlük görsel üzerinde daha fazla ayrıntının görünmesini sağlar. Genellikle daha düşük çözünürlük hızlı süreç, bilgisayar için indirilecek daha az veri ve işlem anlamına gelir, fakat Şekil 1’de gördüğünüz gibi çok düşük çözünürlük okunamayan metin ile sonuçlanır. Öte yandan görselin çözünürlüğü yüksekse herşey kristal berraklığındadır ama sabit disk üzerinde çok fazla yer tutar, bu da uzun indirme süresine neden olur ve kullanıcıları o görselin ekranda görünmesi için daha uzun süre ekran başında beklemeye zorlar. Bu dersin sonlarında boyut ve kalite arasında bir denge kurma konusunda daha fazla bilgi edineceksizin .
Örnek 2 - Mr Smith nerede?
Eğer Firefox, Opera, Internet Explorer veya Chrome gibi belli başlı web tarayıcılardan birini kullanıyorsanız, lütfen CTRL+F ’e basın ve “Smith” kelimesini yazıp ENTER’a basın . Gördüğünüz gibi yazdığınız kelimeye uyanları bu web sayfasının metninde bulmak gayet kolay. Şimdi lütfen bu linki takip edin ve aynısını yapmaya çalışın. Yanıt; hayır imkansız. Bu görüntü, bu web sayfasındaki gibi aynı şeyleri anlatır, hiçbir sorun olmadan her iki versiyonu da okuyabilirsiniz ama içinde geçen belirli bir metni aramak için web tarayıcının arama özelliğini kullanamazsınız. Metin ve görüntü dosyaları arasında pek çok fark vardır ama bu dersin bağlamında en önemli olan metin içinde arama özelliğidir. 
Dijitalleştirme, gerçek bir kitabın dijital formata (tarayıcı veya dijital kamera kullanılarak) dönüştürülmesi ile yapılır. Sonuç olarak, taranmış sayfaları gösteren bir dizi görüntü elde edeceksiniz, bu görüntüleri gözden geçirerek bir kitabı kolayca okuyabilirsiniz. Ama 300 sayfalık bir kitabın içinde belirli bir bilgi aramak zorunda olduğunuzda durumu kolayca gözünüzün önüne getirebilirsiniz. Her bir sayfayı baştan sona gözden geçirip, görüntülerden bütün metni okumak yerine sadece CTRL+F’e basıp aradığınızı bulmak çok daha kolaydır. Ayrıca dijital metin ile başka şeyler de kolayca yapılabilir, örneğin metinden bazı bölümleri kopyalamak gibi.
Metin içeren görüntüyü dijital metne dönüştürmek için ne yapmak gerekir? Bunun için olası iki ana çözüm mevcuttur:
  • bir görsel içindeki metni elle NotePad gibi bir metin editörü kullanarak yazabilirsiniz,
  • veya bu iş için hazırlanmış bir yazılım kullanabilirsiniz, bu yazılım görüntüyü yorumlar ve otomatik olarak dijital metin hazırlar.
Bu otomatik tanıma kulağa çok hoş gelmektedir ama gerçekte ise programın yaptığı hataları bulmak ve düzeltmek için elle bir takım ek işler yapmak gerekir. El yazısıyla yazılmış dokümanların durumunda ise bu tür bir yazılım kullanmak neredeyse olanaksızdır. Bu dersin ilerleyen bölümlerinde karakter tanıma sorunları hakkında daha fazla bilgi okuma şansınız olacak.
Örnek 3 - Bu dosya nasıl açılır?
Objelerin iyi bir çözünürlüğe sahip olması gerektiğini ama yüksek çözünürlüğün daha uzun indirme zamanı anlamına geldiğini biliyorsunuz. Yeni bir dosya formatı düşünün ki çok yüksek çözünürlüğe sahip olsun ve göz kırpma süresinde de yüklensin. Bu formatı kesinlikle kendi dijital kütüphanenizde kullanmak isterdiniz. Ama bir sorun var; bu format çok geniş olarak kullanılmamaktadır, kurulumu biraz karmaşık ek bir yazılım gerektirir ve bu yazılımın arkasındaki şirket lisans için kullanıcı başına 100$ fiyat biçmektedir.
Bu aşırı bir örnekti ama dosya formatı seçerken, dosya boyutu gibi işlevsel kapasiteler yanında daha sonra bahsedeceğimiz diğer faktörlere de dikkat etmeniz gerekmektedir. Aklınızda tutmanız gereken dijital kütüphaneler için en önemli şeyin erişilebilirlik olduğudur.
Özet  - dijitalleştirme neden zordur?
Önceki örnekler başarılı bir dijitalleştirme ve dijital içeriğin daha ileri düzeyde kullanımı için yaşamsal önemi olan birkaç faktörü gösterdi. Analog objenin dijital bir kaynağa dönüştürülmesi süreci incelik isteyen bir iş olabilir, çünkü:
  1. bazen bu iş için birden fazla doğru araç olabilir,
  2. elinizdeki aracı kullanarak nasıl dijitalleştirme yapacağınızı bilmeniz gerekir,
  3. unutmayın eski/değerli nesnelerle uğraşıyorsunuz (dikkatli olun!),
  4. bu, o nesneyi dijitalleştirmek için son şans olabilir, tarama sürecinde ve sonrasında kaliteyi garantileyin,
  5. metin içeren dijital görüntüyü dijital metne çevirmek gerçekten uğraştırıcı bir iş olabilir ama bunu yapmaya değer,

dijital kütüphaneler kullanıcılar için oluşturulur, online olarak yayımlamak için format

2.DİJİTALLEŞTİRME İŞ AKIŞ ŞEMASI

Dijitalleştirme projelerinden birkaç örnek gördünüz ve dijitalleştirmenin kalitesini belirleyen temel faktörlerden bazılarını öğrendiniz. Bu bölümde dijitalleştirme iş akış şeması oluşturma yolları hakkında bilgiler edineceksiniz. Konuya daha ayrıntılı bakmak için çeşitli olası dijitalleştirme işlerine bakalım

İş 1 : "Elimde eski yerel gazetIerden 10 sayı var. Ayrıca meşhur kilisenin bazı fotoğraflarını ve.. bir de geçen hafta kütüphanemizde yaptığımız bir etkinliğin videosunu yayınlamak istiyorum."

İş 2 : "1930 ve 1939 yılları arasında yayımlanmış bir gazetenin bütün sayıları elimizde mevcut ve bunları dijitalleştirmek için kaynak bulduk. Bu gazetelerin tam metin arama kapasitesine sahip dijital versiyonunu oluşturmak istiyoruz."

İş 3 : "Bazı materyallerimiz hasar gördü ama neyse ki elimizde mikrofilmleri var "

Dijitalleştirme projeleri ölçek, mevcut mali kaynaklar, işi bitirme tarihi, şartlar ve taranacak materyalin türü açısından farklılık gösterebilir. Bazı işler sıradan bir dijital kamera ve ortalama bir bilgisayar kullanılarak çabucak yapılabilir ama bazıları ek donanım ve işi düzenlemek için daha resmi bir yaklaşım gerektirir. Bazı örnekler vereceğiz ama önce daha büyük resmi görmeniz açısından lütfen şu dijitalleştirme iş akışını inceleyin:
  1. dijitalleştirme için nesneyi seç,
  2. nesnenin metadatasını hazırla,
  3. dijitalleştirmeyi gerçekleştirmek için doğru ekipmanı seç,
  4. nesneyi tara (scan),
  5. grafik yazılımı kullanarak taranmış görüntüyü düzenle,
  6. dijital nesnenin web üzerinde sunulacak versiyonunu hazırla,
  7. dijital ana kopyayı emniyete al,
  8. nesneyi dijital kütüphanede yayınla.
  1. Bu aşamaların her birini bu dersin takip eden bölümlerinde açıklayacağız .

    Dijitalleştirmeden sadece bir kişinin sorumlu olduğu küçük kurumlarda, iş akışı ve bütün prosedürler o kadar önemli değildir. Ama yine de verilen işi yerine getirmek için yaptığınız işin aşamalarını belgelemek ve yapılması gereken işleri tanımlamak iyi olur.

    Daha çok sayıda insanın dijitalleştirmenin içinde olduğu durumlarda koordinasyon ve yönetim önemlidir ve/veya kalite ve zaman açısından beklentiler daha yüksek olur. Böyle durumlarda, personelinizin beceri ve bilgisine göre sorumlulukları paylaştırmak için bütün iş akışını tanımlamanız zorunlu olacaktır. Bütün işlerin tek bir kişi tarafından ele alındığı iş akışı ile ileri düzeyde malzeme kullanmayı ve kesin olarak tanımlanmış görevler içeren daha karmaşık yüksek performans gerektiren iş akışı arasında temel farklar vardır.

    Bazen, dijitalleştirme tek seferlik bir iş olduğunda kendi dijitalleştirme ekibinizi ve laboratuvarınızı oluşturmaya değmez, koleksiyonunuzu dijitalleştirmek için dışarıdan bir üstleniciye para karşılığı yaptırmayı  düşünebilirsiniz.seçerken bunu aklınızda tutun.

3.DİJİTALLEŞTİRME İÇİN NESNELERİN SEÇİMİ

Bu bölüm, dersin başında da bahsedildiği gibi, dijitalleştirme iş akışının ilk aşaması olan dijitalleştirme için nesnelerin seçimini içerir. Nesnelerin sayısı, türleri ve durumları bütün dijitalleştirme sürecini belirler, o nedenle bu aşama çok önemlidir.

Küçük bellek kurumlarında dijitalleştirme için nesnelerin seçimi gayet basit olabilir, muhtemelen hizmet verdiğiniz müşteriler için hangi nesnelerin önemli olduğunu bilirsiniz. Dijitalleştirme projeniz ister büyük ister küçük olsun, neyi dijitalleştirmek istediğinizi yazmak en iyisidir, örneğin bir basit bir malzeme listesi gibi. Bu size dijitalleştirme için ne kadar iş ve zamana ihtiyacınız olduğunu kestirmeye yardımcı olacaktır. 

Dijitalleştirme sürecini etkileyebilecek bazı çok önemli faktörler vardır, bunlardan en önemlileri şunlardır:There are some very important factors which may influence the digitisation process, the most significant among them includes:
  1. genelde telif ve Entelektüel Mülkiyet Hakları (Intellectual Property Rights (IPR)),
  2. mevcut dijital versiyonların bulunması,
  3. Dijitalleştirmenin yüksek maliyeti.
Entelektüel Mülkiyet Hakları Kütüphanecinin bir kitabı dijital ortama aktaramayacağını söylemez, sorun dijital nesneyi halkın kullanımına açmaktadır. Avrupa Birliği ülkelerinin çoğunun kanunu bu tür bir içeriğin kütüphane sınırları içinde kullanımına izin vermektedir fakat telif hakkı bulunan bir içeriğin Internet üzerinde yayınlanmasına izin vermez.

Eğer bir nesnenin dijital versiyonları zaten mevcutsaikinci kez aynı işlemi yapmaya değer mi düşünmeniz gerekir.

Dijitalleştirmenin yüksek maliyetiprofesyonel video teypleri gibi oldukça nadir analog materyaller açısından geçerli olabilir. Böyle bir durumda, bu iş için yapılmış pahalı dijitalleştirme malzemesi almak gerekebilir. Makul bir çözüm, maliyeti önemli ölçüde düşürebilecek olan dış kaynak kullanılmasıdır (outsourcing).

Dijitalleştirme için nesnelerin seçimi ve iyi bir dijital koleksiyon oluşturma konusunda daha fazla bilgi bu dersin sonraki bölümlerinde verilecektir.

4.DİJİTALLEŞTİRMEDE DIŞ KAYNAK KULLANIMI NE ZAMAN BİR ÇÖZÜMDÜR?

"Dış kaynak kullanımının kesin bir tanımı üzerinde henüz anlaşmaya varılamamıştır. O nedenle terim tutarsız kullanılır. Ancak, dış kaynak kullanımı sıklıkla bir işin dışarıdan bir sağlayıcıya sözleşme ile verilmesi olarak görülür" [kaynak].

Bugünlerde dış kaynak kullanımı endüstrinin çeşitli alanlarında çözüm olarak kullanılmaktadır. Aynı şekilde dijitalleştirmenin farklı aşamalarında da kullanılabilir, özellikle tarama sürecinde ve  bir görüntüden metin alınırken. Aşağıda, dijitalleştirme dış kaynak kullanımı konusunda daha fazla açıklamalarda bulunan Simon Tanner’in “Dijitalleştirme Maliyetini Düşürme El Kitabı”ndan bir bölüm bulacaksınız[kaynak].
"Dış bir sağlayıcı kullanmanın anlamı, üçüncü bir partinin malzeme ve uzmanlığı kullanılabilecek demektir, özel ve pahalı malzemelerin satın alınması ve bakımı proje tarafından yapılmayacaktır. Pek çok proje, satın aldıkları malzemeleri tam aşınma payı bedeli kadar kullanmazlar ve bu da dijitalleştirme maliyetini artırır.
Dış kaynak kullanımının başka nedenleri şunlar olabilir:
  • kısa sürede büyük bir işin yapılacak olması;
  • özel malzemelerin aşırı maliyeti (örneğin ciltlenmiş kitap/dergi veya mikrofilm tarayıcıları gibi);
  • beceri veya deneyim eksikliği nedeniyle kurum içinde ihtiyaç duyulan kaliteyi sunamama; projenin yer, alt yapı veya personel gibi mecburiyetleri kurum içinde dijitalleştirmeyi engelleyebilir; veya
  • çok büyük miktardaki gazete veya mikrofilm tarama, metni yeniden daktilo etme veya XML işaretleme gibi işler için başka ülkelerdeki bürolardan (daha düşük personel ücreti fiyatlarına yansımaktadır) yararlanabilirsiniz."

5.  NESNENİN METADATASINI HAZIRLAMA

Metadata (üstveri) nedir? Metadata genel anlamda veri hakkında veri demektir ve hem dijital hem de dijital olmayan kaynaklara uygulanabilir. Pek çok farklı metadata türleri vardır, her biri farklı bir amaca hizmet etmektedir, hepsinin ortak özelliği vardır – iyi tanımlanmış yapısı. Yapıyı, metadatayı oluşturmak ve kullanmak için gerekli kurallar takip eder. Yapı, kullanım ve oluşturma kuralları,  hem kullanıcılar hem de metadata kayıtları içinde tutulan bilgiyle ilgilenen bilgisayar programları için çok kullanışlıdır.

Metadata sınıflaması

Metadata çok çeşitli uygulamaları desteklemek için kullanılabilir: kaynak keşfi, kaynak yönetimi, uzun dönemli koruma gibi. Bir dijitalleştirme projesi sırasında, kaynakların çeşitli sınıflarını tanımlayan metadata sağlamak gerekebilir, bunlar:
  • dijitalleştirilecek fiziksel nesneler,
  • dijitalleştirme sürecinde oluşturulmuş dijital nesneler,
  • dijitalleştirme sonucu orijinalden türetilmiş bütün nesneler,
  • yukarıdakilerden herhangi birinin koleksiyonları.
Gördüğünüz gibi metadata dijitalleştirme sürecinin bütün sonuçlarına, çeşitli türdeki nesnelere uygulanabilir ve çok farklı amaçlar için kullanılır. Bütün bunlara uyacak tek bir metadata standardına sahip olmak imkansızdır. Metadata standartları alanında daha geniş fikir edinmek için, lütfen aşağıdaki metadata sınıflamasına bakınız.

Metadata şu şekilde alanlara ayrılabilir:
  • kullanıldıkları yerlere göre, örneğin:
    • müzeler,
    • arşivler,
    • kütüphaneler,
  • metadata tarafından desteklenmesi beklenen işlevlere göre:
    • tanımlayıcı metadata
      • dijital nesnenin keşfi ve yorumlanması için kullanılır
    • idari metadata
      • dijital nesneyi yönetmek, oluşturulmasıyla ilgili daha fazla bilgi vermek ve kullanımı ile ilgili kısıtlamaları belirtmek için kullanılır
    • korumaya yönelik metadata
      • uzun süreli korumayı desteklemek içindir
    • yapısal metadata
      • birleşik bir nesnenin parçaları arasındaki mantıksal veya fiziksel ilişkiyi tanımlar
    • koleksiyon düzeyinde tanımlama
      • Koleksiyonlar, etrafında farklı türde dijital hizmetler yapılandırılabilecek elemanlar bütünü olarak görülür. Tanımlanmaları gerekir, böylece kullanıcı koleksiyonun önemli özelliklerini keşfedebilir. Bunlar kapsam, format, sahiplik bilgisi ve erişim kısıtlamalarını içerir. Tanımlama, ayrıca koleksiyonları dijital hizmetlerle bütünleştimeye izin verir.
Not: Uygulamada her bir metadata şeması çeşitli fonksiyonları destekler ve aşağıdaki sınıflamalarla çakışır.

Bu derste daha çok tanımlayıcı metadata üzerinde duracağız, yukarıda bahsedilen diğer metadata türleri bilgisayar programları tarafından otomatik olarak yaratılabilir veya bu dersin kapsamı dışındaki şeylerle ilgilidir.

Yukarıda tanımlanan her metadata türü çeşitli metadata standartları kullanılarak uygulanmıştır, örneğin en önemli tanımlayıcı metadata standartlarından biri Dublin Core Metadata Element Set (DCMES) olarak adlandırılır, aşağıda bu standart kullanılarak oluşturulmuş örnek bir kayıt göreceksiniz.

Yaratan: Rose Bush
Başlık: A Guide to Growing Roses
Tanım: Farklı türlerdeki gül fidanlarının yetiştirilmesi ve bakımı ile ilgili bilgiler.
Tarih: 2001-01-20

DCMES 15 öğe belirlemiştir, Başlık, Yaratıcı, Tanım vb. gibi. Bu maddeler, verilen öğenin tam yorumunun ne olduğunu ve içinde hangi bilgilerin tutulması gerektiği belirtir.
  • Yaratan (Creator), kaynağı oluşturmaktan sorumlu temel kişi hakkında bilgi içerir.
  • Başlık (Title) kaynağa verilen isimdir.
  • Tanım (Description) kaynağın bir açıklamasıdır.
  • Tarih (Date) kaynakla ilgili zaman aralığı veya bir noktadır.

Terminoloji standartları

Bu bölümün girişinde söylendiği gibi, metadata daha çok yapı ve kurallarla ilgilidir. Bu kurallara ve yapıya uyarsanız metadata yararlı olur. Kullanıcılar aradıkları kaynakları bulup kullanabilirler. Yukarıda DCMES metadata kaydının bir örneğini gördünüz. Peki, DCMES ile uyumluluk bütün kullanıcıların metadata kayıtlarında depolanan bilgiye erişebilmesini garanti etmek için yeterli midir?

Metadata kayıtlarında depolanan bilginin en etkili biçimde değişimini sağlamak için şunların olması gerekir :
  • Kullanılan metatada şemasının ortak kabulü,
  • metadata öğelerinde değer olarak kullanılan terimlerin ortak kabulü.

6.TARAMA EKİPMANI

Bu derste tarama (scanning) ekipmanı, görüntü yakalama aletleri anlamında kullanılmaktadır, bunlara her tür tarayıcılar ve dijital kameralar dahildir. Tarama dijitalleştirme iş akışının temel bölümüdür. Bu bölümde çeşitli materyalleri dijitalleştirmek için ne tür donanım kullanılabileğini öğreneceksiniz. Taramaya başlamadan önce o nesne için hangi tür tarayıcının en uygunu olacağına karar vermeniz gerekir. İyi karar verebilmek için aletler arasındaki farkları ve özelliklerini bilmeniz gerekir.

Bazı tür tarayıcılar çok pahalıdır, küçük bir kurum için çok daha pahalıya gelebilir. Bazı aletler gerçekten çok akıllı ve hızlıdır ama bu son model aletleri kullanarak yapılacak pek çok şey dijital kamera veya düz yataklı bir tarayıcı kullanılarak da yapılabilir.

Tarama ekipman türleri

Aşağıda temel olarak sınıflanmış ve kısa açıklamaları yer alan tarama aletlerini göreceksiniz. Açıklamaların çoğu bu metne dayanmaktadır: [kaynak].

Düz yataklı (flatbed) tarayıcılar
  • "Düz yataklı tarayıcılar en çok bilinen ve en çok satılan tarayıcı türüdür, bunun için iyi nedenleri vardır. Bunlar çok amaçlı, kullanımı kolay ve kolayca bulunabilen türlerdir. Web yayıncılığı alanındaki popülerlikleri büyük bir pazar yaratmış, giriş düzeyinde fiyatları 100$ altına indirmiştir."
  • "Otomatik doküman tutucular (Automatic document handlers (ADH)), bazı modellerde mevcuttur ve çıkan iş oranını artırabilir. Kabul edilebilir derecede iyi durumda olan ve birbirine benzeyen doküman setleri için işletim zahmetini azaltır."
  • "Düz yataklı tarayıcıların özel bir türü üstten kitap tarayıcıdır, tarayıcının ışık kaynağı, sensor düzeni ve optikler üstteki düzenekte yer alır, bunun altına taranacak ciltli kitap yüzü yukarı bakacak şekilde yerleştirilebilir."
Kağıt beslemeli (Sheetfeed) tarayıcılar
  • "Bu tarayıcılar düz yatak tarayıcılarla aynı teknolojiyi kullanır, fakat işin çıktısı en üst düzeye çıkarır, genellikle kaliteden ödün verir. İş miktarı çok olan işletme ortamları için düzenlenmiştir, oldukça düşük çözünürlükte siyah ve beyaz veya gri tonlamalı tarama yaparlar."
Tambur (Drum) tarayıcılar
  • "En yüksek çözünürlük, en yüksek kalitede tarama yapan tarama türüdür, fakat buna göre de fiyatı vardır. Fiyatlarının yanı sıra tambur tarayıcılar yavaştır, hassas dokümanlar için uygun değildir ve yüksek işletim becerisi gerektirir."
Mikrofilm tarayıcıları
  • "Rulo film, fiş ve apartür kartlar (mikrofilm kartı) için uzmanlaşmış bir alettir. Bir mikrofilm tarayıcıdan iyi, tutarlı kalite elde etmek zor olabilir çünkü işletim açışından karmaşıktır, film kalitesi ve filmin durumu farklı olabilir, ayrıca çok az iyileştirme kapasitesi sunarlar."
Slayt (Slide) tarayıcıları
  • "Mevcut slayt kütüphaneleri ve 3 boyutlu nesnelerin fotoğrafları ile doğrudan taramaya elverişli olmayan dokümanların dijitalleştirilmesi için kullanılırlar."
Dijital kameralar
  • "Dijital kameralar, kamera gözleri ile bir tarayıcıyı birleştirip en üst kalitede görseller üretebilen çok amaçlı aletlerdir. Düz yataklı tarayıcılara göre daha yavaş ve kullanımı zor olmasına rağmen dijital kameralar çok çeşitli doküman ve nesnelere uyarlanabilir. En hassas materyaller bile emniyetli bir şekilde kaydedilebilir, ancak dış ışıklandırmaya ihtiyaç duyduğu için, ışığın vereceği zarar endişe yaratabilir."

Uygun tarayıcı nasıl seçilir?

"Moving Theory into Practice: Digital Imaging Tutorial (Teoriyi Uygulamaya Taşıma: Dijital Görselliştirme Rehberi)" kaynağına göre [kaynak] :

"Tarayıcı özelliklerini değerlendirmek zor olabilir ve genellikle standart eksikliği vardır, o nedenle anlamlı karşılaştırmalar yapmak olanaksızdır. [...] Mevcut tarayıcıların ayrıntılarını okurken, bunların büyük pazarlar için, örneğin büyük işletmeler içindeki grafik sanatları bölümleri gibi, tasarlandığını aklınızda tutun. Çok azı kütüphane ve arşivlerin özel ihtiyaçlarını karşılamak üzere tasarlanmıştır. Hedefiniz çok az ödün vererek, ihtiyacınıza en uygun olanı bulmak olacaktır."

Tarayıcı seçerken aklınızda bulundurmanız gerekenler  [kaynak]:
  • Çeşitli kağıt boyutlarını ( A4, A0), doküman türlerini (tek yaprak, ciltli), ortamı (yansıyan, şeffaf) işleyebilecek mi? Çok kötü durumdaki bir nesneyi bile taramak mümkün mü?
  • Bu tarayıcı, hedefimize uygun kalitede görseller üretebilecek mi?
  • Bu tarayıcı üretim için hedeflediğimiz takvime uyabilecek ve ödediğimiz paraya değecek mi? Yeterince hızlı ve kullanımı kolay mı?
  • Doküman işleme yetenekleri nelerdir?
  • İş zamanı, MTBF (Mean Time Between Failure-Arızasız Geçen Ortalama Süresi) ve ömür boyu kapasitesi nedir?
  • Ne tür bakım/servis hizmetleri mevcuttur (24-saat yenileme, servis)?
Tarayıcı ekipmanlar ve bunların etkili olarak kullanımı konusundaki sorular bu derste daha sonra tekrar gündeme gelecektir.

7.GRAFİK OLARAK İLERİ İŞLEME

Grafik ileri işleme her zaman gerekli değildir, şu durumlarda kullanılmalıdır:
  • tarayıcı ayarındaki hataları düzeltmek için
    • tarayıcıdan elde edilen görüntü orjinalinden çok farklı görünür, bazen grafik yazılım kullanarak renkleri düzeltmek mümkündür. Böylece bütün taramayı yeniden yapmanız gerekmez.
  • görüntüyü döndürme
    • işletimci veya makine hatası nedeniyle, incelemeyi zorlaştıracak şekilde görüntüler eğri olabilir. Bu da uygun yazılım kullanılarak kolayca düzeltilebilir.
  • görüntüleri istenen dosya formatına çevirme
    • farklı tarayıcılar farklı formatlarda dijital görüntüler üretir, bu formatlardan bazıları görüntüleri uzun dönemli saklama amacına uygun değildir.
Grafik ileri işleme Photoshop veya GIMP gibi grafik yazılımlar kullanılarak yapılabilir.

8.METİN YAKALAMA

Daha önce de söylendiği gibi, tam anlamıyla erişim sağlamak ve dijital dokümanın sunduğu bütün özelliklerden yararlanmak için, metin içeren görüntüleri (örneğin taranmış bir kitap görüntüsü) yayımlamak yeterli değildir. Dijital metin doküman içinde arama yapmaya olanak verir, duymayanların metne erişimlerini sağlamak için ekrandaki metni okuyan bilgisayar programlarına da izin verir. Ayrıca depolanan metin dokümanının daha etkili kullanımına izin veren başka yararlı uygulamalar da vardır. Tarama sonucu elde edilen görüntüden metni yakalamak için genellikle iki yol vardır:
  1. bir görüntüden metin yakalanır ve Notepad gibi metin editörleri kullanılarak yazılır,
  2. veya görüntüyü yorumlayıp dijital metni otomatik olarak hazırlayan, bu iş için yapılmış yazılım kullanılabilir.
İlk seçenek gayet basit görünmektedir ama gerçekte çok pahalı ve yavaştır. Bu iş için tahsis edilmiş optik karakter tanıyıcı (optical character recognition -OCR) yazılımları çok daha hızlıdır ve iyi sonuçlar verebilir. Modern OCR uygulamaları (veya motorları) basılı metni tanıma konusunda çok düzgün çalışmaktadır. Ancak OCR, farklı puntolar ve yazı stilleri içeren eski basmalar veya dokümanlar üzerinde kullanıldığında sonuçların kalitesi kötüleşmektedir.  %100 doğru dijital metin elde etmek için OCR uygulamalarından elde edilen sonuçlar, dijital kütüphanede yayımlanmadan önce kontrol edilmelidir.

OCR yazılım performansı için ne önemlidir?

OCR çıktı kalitesini etkileyen bir takım faktörler vardır.
  • Doküman türü
    • kalite, OCR’in basılı bir metin üzerinde mi yoksa el yazması üzerinde mi kullanıldığına bağlıdır.
  • Baskının kalitesi
    • daha kaliteli baskı daha kaliteli sonuca izin verir.
  • Orijinal dokümanın kalitesi
    • Eğer orijinal nesne hasarlı veya zor okunur durumda ise OCR’den çok iyi kalite bekleyemezsiniz.
  • Tarama çözünürlüğü, renk sayısı
    • Bazı dokümanlarda renk sayısının azlığı bilginin kaybolmasına neden olabilir, aynı şey çözünürlük için de geçerlidir. Bilgi kaybı da OCR kalitesini düşürecektir.
  • OCR yazılımı, genellikle yüksek kontrasta (karşıtlık) sahip görüntüler ile daha iyi çalışır
    • OCR yazılımı için, harflerin şeklini ayırt etmek önemlidir, bunu yapmak yüksek kontrasta sahip görüntüler için daha kolaydır.
  • Metin dili
    • Çoğu modern OCR motorlorı heceleme hatalarını düzeltmek için sözlükler kullanırlar. Bazı pek bilinmeyen diller için sözlük (ve genelde dil kaynakları) bulmak zordur, bu durumda OCR çıktı kalitesi düşük olabilir.
  • Metin yerleşimi (mizanpaj)
    • Kitapların metin yerleşimi (tek sütun), gazetelerden (resimli, birden fazla sütun) farklıdır, metin yerleşimi karmaşıklaştıkça OCR motorundan iyi sonuçlar almak zorlaşacaktır.
  • Metin formatı
    • Satır, sütun ve sayfa kenarlarındaki beyaz alan elverişli olduğunda metnin sınırları daha iyi belirlenebilir.
Piyasada birden fazla OCR uygulamaları mevcuttur ve gördüğünüz gibi dikkate almanız gereken farklı durumlar vardır. En iyisini bulmak için en kolay yol, dijitalleştirmek istediğiniz nesneler üzerinde OCR uygulama/motorunu denemektir. OCR yazılım satıcıları, genellikle uygulamalarının ücretsiz deneme versiyonlarını sunarlar, denemek için ürünü satın almanız gerekmez.

En iyi sonuçları almak için hangi yöntem seçilmelidir?
  • Mümkünse, satın almadan önce OCR yazımını deneyin,
    • OCR yazılımı pahalı olabilir, bu da sizi bu yazılımı kullanmaktan alakoyabilir. Ücretsiz çözümler mevcuttur ama IT (bilgi teknolojileri) bilgisi gerektirir.
    • Kaynaklarınız için en iyi sonucu verecek OCR motoruna karar vermek için deneme versiyonlarını kullanın.
  • Eğer OCR yazılımı sizin işinize yaramıyorsa, elle metni alma yolunu düşünün.
    • Bu süreci hızlandırabilecek bazı çözümler mevcuttur, bunlar üzerinde daha sonra daha ayrıntılı durulacaktır.

9.TARANMIŞ NESNENİN WEB SUNUMU VERSİYONU

Dijitalleştirmenin amaçlarından biri korumaktır, nesnenin dijital kopyasının daha sonra kullanılmak üzere korunması önemlidir, hatta orijinal nesne artık okunamayacak duruma geldiğinde sadece dijital kopya kullanılacaktır. Dijital kopya oluşturma tarama ile yapılır ve bazen çok zahmetli, zor bir iştir. Bu nedenle amaç mümkün olduğunca orijinal üzerinde daha az tarama yapmaktır. Bunu başarmak için görüntüyü çok yüksek çözünürlükte taramak uygundur, bu sayede orijinal nesnenin bütün detaylarını saklarsınız. Ayrıntıların bu derece fazla olması gerekmeyecekse, tarama işini tekrarlamadan nesneyi düşük çözünürlükte üretmek her zaman mümkündür. Doğru çözünürlüğü seçme konusunu daha sonra öğreneceksizin, bu bölüm web'de sunma kavramını içerir.
Yüksek çözünürlükte tarama yapmak iyi bir seçim gibi görünür ama nesnenin İnternet'te sunumu ne olacak? Yüksek çözünürlüğe sahip bir resim ana bellekte çok fazla yer tutar, mevcut bant aralıklarında indirme süreleri çok uzun olabilir. Kullanıcılar beklemeyi sevmez! Hatta İnternet'in giderek hızlanacağını düşünsek bile, yüksek kaliteli (çözünürlüklü) görselleri sunmak yine de sorun olabilir. Belki bir kaç yıl içinde bu sorun çözülebilir ama şimdi ne yapmak gerekir. Çözüm gayet basittir, ayrı bir düşük çözünürlüklü kopya - web'de sunum versiyonu hazırlamaktır. 

Avustralya Milli Kütüphanesi gibi büyük kurumlar, orijinal dijital nesnenin aşağıdaki farklı görüntülerini gösterirler [kaynak]:
  • Küçük resim kopyası
    • büyük görüntüden daha küçüktür, bir grup görsele daha kolay ve hızlı bakmayı sağlamak için tasarlanmıştır.
  • İzleme kopyası
    • ekrana rahatça sığacak ve standart bir A4 kağıdına basılacak şekilde tasarlanmıştır.
  • İnceleme kopyası
    • daha ayrıntılı izleme sunar, sayfanın değişik bölümlerini incelemek için İnternet tarayıcınızın aşağı kaydırma çubuğunu kullanmanız gerekebilir, indirme süresi daha uzun olacaktır.
  • Yazdırma kopyası
    • yazdırma için uygun, yüksek kaliteli versiyon.
  • Etkileşimli kopya
    • kullanıcıların ihtiyaçlarına göre görüntünün boyutunu ve kalitesini ayarlamasına izin verir.
Her bir kopya değişik bir amaç için oluşturulmuştur, farklı ayrıntı düzeyi sunar fakat bunların hepsi orijinal taranmış görüntüden - ana kopyadan üretilmiştir.
Hatırlamanız gerekenler:
  • Ana kopya -yüksek çözünürlük, uzun indirme süresi
    • orijinal taranmış görüntüdür, bütün diğer versiyonlar, nesnenin kendisini tekrar taramaya gerek olmadan, bu kopyadan yaratılabilir.
  • Web sunumu versiyonları - daha düşük çözünürlük, daha kısa indirme süresi
    • Ana kopyadan türetilmiş versiyondur, genellikle özel amaçlara hitap eder, örneğin arama sonuçlarında küçük resim gösterme gibi.
    • gerekli web sunumu versiyonlarının oluşturulması otomatik olarak dijital kütüphane yazılımı tarafından yapılabilir.
Bu nedenle Ana kopya çok önemlidir ve iyi saklanması gerekir. Fakat en çok yapılan hatalardan biri web sunum versiyonlarının oluşturulmasından sonra Ana kopyanın silinmesidir. Dijital ana kopyanın önemini kavramalı ve öncelikli olarak korumalısınız.

10.NESNENİN WEB'DE YAYINLANMASI

Dijital nesneyi web'de yayınlamak için ne gerekir? Sıradan bir web sitesi yeterli midir? Genelde dijital nesnelerinizi İnternet'te yayınlamak için çok şey yapmanıza gerek yoktur. Bir hesap oluşturup yükleyebilirsiniz:
  • resimlerinizi Flickr.com'a,
  • PDF kopyalarınızı Scribd.com'a,
  • videolarınızı youtube.com'a.
Bunlar milyonlarca kullanıcı tarafından her gün kullanılan web siteleridir. Bu siteler genel izleyiciye hitap eden araçlardır, dijitalleştirme, koruma ve karmaşık metadata şemaları sunmazlar, örneğin youtube videonuz için Dublin Core ile uyumlu metadata tanımı yapma yolu yoktur. Bir diğer sorun da kullanıcınız kendini biraz kaybolmuş hissedebilir, kurumunuz tarafından yayınlanmış bir fotoğrafı görmek için Flickr'a gitmek, sonra da PDF bir dokümanı okumak için Scribd'e atlamak zorunda kalacaklardır.
Bu iş için hazırlanmış bazı dijital kütüphane yazılım paketleri vardır, yukarıda belirtilen sorunları çözmek ve değerli nesnelerin dijitalleştirilmesini desteklemek için geliştirilmişlerdir. Bu tür bir yazılım, çeşitli metadata şemaları üzerine geliştirilmiş ileri arama yetenekleri ve diğer pek çok faydalı özellikler sunarlar. Ama özünde, dijital kütüphane yazılımı dijital içeriğinizi kolayca yönetmenizi ve yayınlamanızı sağlayacak, dijital kütüphane yazılım alt yapısını oluşturmanıza izin verir.
Dijital kütüphane, sadece bir yazılım alt yapısından ibaret değildir, bu dersin sonraki bölümlerinde bütün bir dijital kütüphane kavramı daha ayrıntılı olarak ele alınacaktır.

Nesnenin dijital kütüphanede yayınlanması

Nesneyi dijital kütüphanede yayınlamak için ne yapmak gerekir? Genellikle yayınlama süreci çok basittir ama seçilen yazılımla çok ilgilidir. Başlamadan önce emin olmanız gereken konular:
  1. Dijital kütüphaneye erişiminiz vardır;
  2. Dijital kütüphane yazılımı, nesneleri tanımlamak için kullandığınız metadata şemasını desteklemektedir
    1. eğer desteklemiyorsa bir şemadan diğerine aktarma yapmak zorundasınız veya başka bir yazılım seçin.
  3. Nesnelerin hazırlanan web sunum kopyalarının dijital formatı, dijital kütüphane yazılımı tarafından desteklenmektedir.
Bazı dijital kütüphane sistemleri korumayı destekler, sadece web sunum versiyonunu değil aynı zamanda dijital ana kopyayı da koyabilirsiniz. Genellikle ana kopyaları koruma dijital kütüphane yazılımı tarafından yapılmaz.
Bütün bu adımlar yerine getirildikten sonra veriyi sisteme koymak gerekir.

Dijital doğmuş materyal

Dijitalleştirilmiş materyalden ayrı olarak, dijital bir materyal olarak doğmuş dokümanlar da mevcuttur. Bu tür dokümanlar da değerli olabilir ve korunmaları ve dijital kütüphanede sunulmaları gerekir. Korumanın bu alanı çoğu zaman dikkate alınmaz, oysa sadece eski gazeteleri değil aynı zamanda dijitalleştirme gerekmeyen, zaten dijital formatta mevcut olan kaynakları da hazırlamanız ve dikkate almanız gerekir.

11.DERS ÖZETİ - BÜTÜN BUNLAR NASIL DÜZENLENİR?

Bu derste dijitalleştirmenin neden zor olabileceğini öğrendiniz:
    1. bazen iş için birden fazla doğru araç vardır,
    2. elinizdeki araçla ne zaman dijitalleştirme yapılacağını bilmeniz gerekir,
    3. unutmayın eski/değerli nesnelerle uğraşıyorsunuz, dikkatli olun ,
    4. bu, dijitalleştirme için o nesnenin son şansı olabilir, tarama süreci sırasında ve sonrasında kaliteyi garanti altına almak zorundasınız,
    5. metin içeren dijital görüntüyü dijital metne çevirmek çok zor bir iştir ama bunu yapmaya değer,
    6. dijital kütüphaneler kullanıcılar için oluşturulur, online yayın için format seçerken bunu aklınızda tutun.
Temel dijitalleştirme iş akışını oluşturan bölümleri okudunuz:
    1. dijitalleştirme için nesneleri seçin,
    2. nesnenin metadatasını hazırlayın,
    3. dijitalleştirme işlemi için doğru ekipmanı seçin,
    4. nesneyi tarayın,
    5. grafik yazılım kullanarak taranmış olan nesneyi düzeltin,
    6. dijital nesnenin web sunum versiyonunu hazırlayın,
    7. dijital ana kopyayı emniyete alın,
    8. nesneyi dijital kütüphanenizde yayınlayın.
Dijitalleştirme için nesneleri seçerken neleri dikkate alacağınızı ve dijitalleştirme süreci için ne zaman dış kaynak kullanmak gerektiğini biliyorsunuz.

Dijitalleştirmede metadata oluşturma süreci çok önemlidir, nasıl bölümlenebileceğini ve dijital kütüphaneler dünyasında ne tür metadata ile karşılaşacağınızı biliyorsunuz.
Tarayıcı türlerini ve uygun tarayıcı seçimini belirleyen etkenleri okudunuz. Dijitalleştirme sürecinde grafik ileri işlem sürecinin rolünü de okudunuz.

Metin içeren görüntülerle dijital metnin aynı olmadığının farkında olmalısınız.Taranmış görüntülerden dijital metin üretme konusunda en iyi sonuçları almak için yöntemler seçmeniz gerekir.
Dijitalleştirme iş akışındaki bütün aşamalar yerine getirildikten sonra, dijital nesne web'de yayımlanabilir. Artık sıradan bir web sitesi ile dijital kütüphane arısındaki farkı biliyorsunuz. Dijital ana kopyanın neden önemli olduğunu ve web sunum versiyonu yaratmanın neden gerekli olduğunu da biliyorsunuz. Ayrıca dijital formda doğmuş - dijital doğmuş nesnelerin içeriğinin de korumsanının önemi açık olmalı.

Referanslar listesi
  • "Outsourcing", Wikipedia [link]
  • "Handbook on Cost Reduction in Digitisation", Simon Tanner [link]
  • "Moving theory into practice, Digital imaging tutorial", Cornel University Library [link]
  • "Images for Web delivery - standards", National Library of Australia [link]


2.   DİJİTALLEŞTİRME EKİPMAN VE YAZILIMI
Bu konuda farklı türlerdeki kültürel objelerin dijitalleştirilmesi için ne tür temel ekipman gerektiğini göreceksiniz. Ayrıca nesnelerin dijitalleştirilmesinde ne tür yazılımın yararlı olacağını öğreneceksiniz.
İlk derste tarayıcılar gibi temel dijitalleştirme ekipmanı hakkında bilgi edineceksiniz, ayrıca dijital kameralar da incelenecek. En kaliteli sunum ve erişimi elde etmek için tarama yaptıktan sonra sonuçlar üzerinde bazı ek iyileştirmeler gerekebilir, o nedenle görüntü, metin, ses/video üzerinde değişiklik yapmak için ne tür yazılımın yararlı olabileceğini de öğreneceksiniz. Son derste kendi dijitalleştirme laboratuvarınızı kurmanın ne zaman gerekli olduğunu öğreneceksiniz, bazı durumlarda ise bu iş için gerekli bütün ekipman ve deneyime sahip ticari bir dış kaynak kullanmak daha akla yatkındır.

İçindekiler

  1. Dijital görüntü anatomisi
  2. Tarayıcı türleri, dijital kameralar
  3. Uygun tarayıcı nasıl seçilir?
  4. Tarama ekipmanı ile ilgili teknik özelliklere genel bakış
  5. Dersin özeti

1.    DİJİTAL GÖRÜNTÜ YAPISI

Daha önce hiç bunları duydunuz mu; piksel, çözünürlük, sıkıştırma veya renk derinliği? Eğer duymadıysanız bu bölümü dikkatlice okumanız gerekir, çünkü bu terimler dijital görüntünün nasıl çalıştığını anlamayla çok ilgilidir. Wikipedia'ya göre; "Bir dijital görüntü, bir'ler ve sıfır'lar (binary) kullanarak iki boyutlu bir görüntünün temsil edilmesidir" [kaynak]. Bilgisayar programları bu bir'leri ve sıfır'ları nasıl yorumlayacağını bilir ve bilgisayarın ekranında bir dijital görüntüyü gösterebilir. İki tür dijital görüntü vardır, dijital görüntü dendiğinde genellikle matris-satır görüntü (raster image) düşünülmektedir, çünkü en genel olanlar bunlardır. Ayrıca vektörel görüntüler de mevcuttur, matris görüntülerden farklı bir şekilde oluşturulur ve değişik özellikler sunarlar. Vektör görüntüler bu dersin kapsamında çok önemli değildir, çünkü mevcut tarama ekipmanının çoğu matris görüntüler üretir.

Matris dijital görüntüler piksel denilen unsurlardan oluşur. Her matris görüntü piksellerle dolu belirli bir sayıda satır ve sütun içerir. Her piksel kendi renk ve parlaklığı ile ilgili bilgi tutar. Pikseller bilginin temel üniteleridir, dijital görüntüde daha çok piksel olması ona bakan kullanıcıya daha çok bilgi sunabilir(görüntü daha ayrıntılı olabilir veya daha büyük nesneleri gösterebilir). Daha çok veya daha az miktarda bilgi tutma kapasitesi görüntü çözünürlüğü olarak adlandırılır. Daha çok piksel, daha yüksek piksel çözünürlüğüdür ve görüntüdeki nesne daha detaylı sunulur. Görüntü çözünürlüğü çeşitli yollardan ölçülebilir, örneğin piksel sayısıyla.
Bahsettiğimiz gibi piksel, renk ve parlaklığı ile ilgili bilgiler tutar, bu bilgi daha çok veya daha az detaylı olabilir. Renk hakkındaki bilginin miktarı renk derinliği olarak adlandırılır ve piksel başına bit (bits per pixel - BPP) olarak ölçülür. En küçük BPP 1'dir, bu durumda her piksel sadece iki renk bilgisi şifreleyebilir, örneğin verilen piksel siyah veya beyazdır. Modern bilgisayarlar yaklaşık 16.7 milyon farklı renk bilgisi depolamaya izin veren 24 BPP ile kolayca başa çıkabilirler. 16.7 milyon rengin çok büyük olduğunu düşünebilirsiniz fakat bazı profesyonel dijital kameralar üretilen görüntünün daha kaliteli olmasını sağlamak için daha büyük renk derinliği kullanmaktadır.

Figure 1: Farklı piksel çözünürlüklerine sahip görüntüler [kaynak].

Söylediğimiz gibi dijital görüntü çözünürlüğü şifrelediği bilgi kapasitesini tanımlar, görüntü çözünürlüğü dijital görüntü yapısının farklı noktalarını tanımlayabilir.
  • Piksel çözünürlüğü
    • görüntünün her bir boyutundaki piksel sayısı ile açıklanabilir
      • örneğin 640 x 480 - burada ilk sayı piksel sütun sayısıdır (genişlik) ve ikinci piksel satır sayısıdır (yükseklik),
    • veya görüntüdeki toplam piksel sayısı olarak
      • örneğin 0,3 mega piksel, 307200 (640 kere 480) pikseldir – bu bilgi dijital kamera üreticileri tarafından kullanılır.
  • Renk çözünürlüğü
    • Piksel renk bilgisini kodlamak için bit sayısı kullanılır, örneğin       24 BPP (16.7 milyon renk) veya 1 BPP (2 renk, çift tonlu görüntü).
Çözünürlüğün bu iki hali, bu ders için çok önemlidir. Ayrıca çözünürlüğü, verilen bir uzunluktaki piksel yoğunluğu açısından da ölçmenin yolu vardır, örneğin her inçe (inch) düşen piksel sayısı. Tarayıcı gibi görüntü yakalayan aletlerle uğraştığınızda bu, özellikle önemlidir. İnç başına düşen piksel sayısı yüksekse, taranan görüntünün daha fazla ayrıntısı görünecektir.
Lütfen Şekil 1'e bakın, aynı görüntünün farklı piksel çözünürlüklerinden örnekler gösterir.
Dijital görüntü yapısını anlamak için önemli olan bir diğer terim de sıkıştırmadır (compression). Dijital kameralar ve diğer dijital görüntüleme araçları giderek daha da avantajlı hale geliyor, sıradan bir dijital kamera tarafından alınan dijital görüntüler bile pek çok ayrıntı - çok büyük miktarda piksel içeriyor. Bahsedildiği gibi, daha çok miktarda bilgi (daha fazla piksel, daha fazla bilgi) daha uzun indirme zamanı alacak demektir ve ana bellekte o görüntüyü saklamak için daha çok yer tutacaktır. Uzmanlar yüksek kaliteli görüntülerin dosya boyutunu ve indirme zamanını sınırlamak için ne yapmak gerektiği üzerinde düşündüler.Bu da sıkıştırma ile mümkün olabilir. Sıkıştırma (veya sıkıştırılmış olanı açma) grafik editörleri, görüntüleyiciler, web tarayıcılar ve diğerleri gibi bilgisayar programları tarafından yapılır. Çok çeşitli şekillerde çalışabilir, örneğin farklı düzey ve sıkıştırma oranları olabilir, kayıplı veya kayıpsız olabilir. Belirli bir yöntemin kullanılması genellikle bilgisayarın ana belleğinde dijital görüntüyü saklamak için kullanılan dosya formatı ile ilgilidir. Bazı dosya formatları ya sıkıştırılmış (kayıpsız) ya da sıkıştırılmamış bilgi tutabilirler, örneğin TIFF. Farklı dosya formatları, boyut veya alabildiği renk derinliği gibi özellikleri nedeniyle farklı amaçlar için kullanılabilir. En çok kullanılan dosya formatlarından bazıları bu derste daha sonra tanımlanacaktır. 
Bu dersin kapsamında, kayıplı ve kayıpsız sıkıştırma arasındaki farkı anlamanız önemlidir. Kayıplı sıkıştırma bilgi kaybı ile dosya boyutunu düşürme arasında bir ortalama gibidir. Kaybolan bilginin miktarı, sıkıştırma oranı (daha büyük oran, daha çok bilgi kaybı ve daha küçük dosya boyutu) kullanılarak ayarlanabilir. Unutmayın, kayıplı sıkıştırma tek yönlü bir süreçtir, daha küçük dosya boyutu karşılığında bir görüntünün bazı bilgilerini kaybedersiniz. Bilgi kaybolduğundan, sıkıştırılan görüntüyü geri açtıktan/genişlettikten sonra orijinal görüntüyü alamazsınız. Kayıpsız sıkıştırmada bu sorun yoktur, görüntü herhangi bir kayıp olmaksızın tekrar açılabilir fakat genellikle kayıplı sıkıştırma yöntemleri daha küçük dosyalar verir.

Dijital görüntüleme için renk ve piksel çözünürlükleri yanında sıkıştırma türü de çok önemlidir. Unutmayın, tarama cihazı ile üretilen her dijital görüntü piksellerden oluşur - renkler hakkında bilginin temel üniteleri. Görüntüde çok piksel olması, görüntünün piksel çözünürlüğünün daha yüksek olması demektir. Renk çözünürlüğü, bazı uygulamalar için diğer önemli bilgidir. 1 BPP yeterlidir ama modern donanımlar 16.7 milyondan fazlasını yakalamaya kolayca izin verir.
Yüksek çözünürlük görüntü dosya boyutunun çok yüksek olmasına neden olur (uzun sürede yüklenmesi ile sonuçlanır). Dosya boyutu, çeşitli sıkıştırma algoritmaları kullanılarak düşürülebilir, bunlardan bazıları çok etkili sıkıştırma oranı sunar ama aynı zamanda kayıplıdır - sıkıştırma sürecinde bazı bilgiler kaybolur.

2.TARAYICI EKİPMANLARI

Bu bölümde tarayıcı ekipmanları terimi dijital kameralar dahil bütün görüntü yakalama aletleri için kullanılacaktır. Tarama, dijitalleştirme iş akışının temel bölümüdür. Taramaya başlamadan önce o nesne için ne tür tarayıcının en iyi sonucu vereceğine karar vermeniz gerekir. İyi karar verebilmek için aletler arasındaki farkları ve özelliklerini bilmek zorundasınız. Bu bölümde bazı tarayıcı ekipman örnekleri, bunların farklı materyallere uygulanabilirliği ile birlikte anlatılacaktır.
Tarayıcı ekipman türleri
Aşağıda kısa tanımlarıyla birlikte tarama aletlerinin temel sınıflamasını bulacaksınız [kaynak]
Düz yataklı (Flatbed) tarayıcılar
Figure 1: Düz yataklı tarayıcı [kaynak]
  • Düz yataklı tarayıcı genellikle bir cam levha (veya silindir), bunun altında levhayı aydınlatan parlak bir ışık ve hareketli optik sensörlerden oluşur. Taranacak materyal yüz üstü camın üzerine yatırılır, çevreden ışık almasını önleyecek olan ışık geçirmez kapak üzerine kapatılır, optik sensör ve ışık levha boyunca hareket ederek bütün alanı okur. Böylece sensörler camın üzerindeki görüntüden yansıyan ışığı alırlar.  [kaynak].
  • Düz yataklı tarayıcılar en çok bilinen ve en çok satan tarayıcı türleridir. Çok amaçlı, kullanımı kolay ve her yerde bulunabilirler. Popüler olmaları, fiyatlarını başlangıç düzeyinde üniteler için 100$ altına iter.  [kaynak].
  • Bazı düz yataklı tarayıcıların Otomatik Doküman Tutucuları - Automatic Document Handlers (ADH) mevcuttur, iyi durumda olan bir dizi aynı biçimdeki dokümanlar için çıkan iş miktarını artırıp, işleme zahmetini azaltabilirler [kaynak].
  • "Düz yataklı tarayıcıların özel bir türü üstten kitap tarayıcıdır, tarayıcının ışık kaynağı, sensör düzeni ve optikler üstteki düzeneğe taşınmıştır, bunun altına taranacak ciltli kitap yüzü yukarı bakacak şekilde yerleştirilebilir. [kaynak]"

  • Figure 2 Uzmanlaşmış bir kitap tarayıcı. Görüntü  Ben Woosley tarafından yaratılmıştır, Creative Commons lisansı altında kullanılmaktadır [kaynak].

    Kağıt beslemeli (Sheetfeed) tarayıcılar
  • "Bu tarayıcılar düz yatak tarayıcılarla aynı teknolojiyi kullanır, fakat işin çıktısı en üst düzeye çıkarır, genellikle kaliteden ödün verir. İş miktarı çok olan işletme ortamları için düzenlenmiştir, oldukça düşük çözünürlükte siyah ve beyaz veya gri tonlamalı tarama yaparlar. [kaynak]"
Tambur (Drum) tarayıcılar        
  • Tambur tarayıcılar en yüksek çözünürlüğü yakalar ve en yüksek kalitede tarama yapar fakat fiyatları çok pahalıdır. Fiyatlarının yanı sıra tambur tarayıcılar yavaştır, hassas dokümanlar için uygun değildir ve ayrıca yüksek işletim becerisi gerektirir [kaynak]. Tambur tarayıcılar neye benzer? buraya bakın.
Mikrofilm tarayıcılar
  • Bu tür tarayıcı rulo film, fiş ve aprtür kart (mikrofilm kartı) için uygundur.
  • "Bir mikrofilm tarayıcıdan iyi ve tutarlı kalite elde etmek zor olabilir çünkü işletim açışından karmaşıktır, taranacak mikrofilmin kalitesi ve durumu farklı olabilir, ayrıca çok az iyileştirme kapasitesi sunarlar. [kaynak]"
  • Mikrofilm tarayıcılar çok hızlıdır, dakikada 500 sayfa kadar bile tarayabilirler [kaynak].
Slayt tarayıcılar
  • Slayt tarayıcılar slayt kütüphanelerinin dijitalleştirilmesinde kullanılır.
Dijital kameralar
  • Dijital kameralar kamera gözleri ile bir tarayıcıyı birleştirir, böylece çok kaliteli görseller üretebilen bir alete sahip olabilirsiniz ve tarayıcıların cam levhalarının boyutlarıyla sınırlı kalmazsınız.
  • Dijital kameralar genellikle daha yavaştır ve düz yataklı tarayıcılara göre işletimi daha zordur.
  • Bu tür tarayıcı aletler hem küçük ve hem de çok büyük nesneleri tarayabilirler.
  • "En hassas materyaller bile emniyetli bir şekilde kaydedilebilir, ancak dış ışıklandırmaya ihtiyaç duyduğu için, ışığın vereceği zarar endişe yaratabilir." [kaynak]
  • Şekil 3 dijital kamera kullanılarak bir kitabın nasıl taranabileceği gösterilmektedir, dijital kamera genellikle taranacak nesnenin üzerine, özel bir standa monte edilir

Şekil 3 : Dijital kamera kullanılarak kitap tarama [Üstte özel bir tutucuya monte edilmiş dijital kamera, üst yanlarda ışık kaynakları, masanın üzerinde beyaz arka zemin ve onun üzerinde kitap yer alır, Ç.N.] [kaynak]

Diğer aletler
  • 3 Boyutlu (3D) dijitalleştiriciler, heykel gibi 3 boyutlu nesneleri taramaya izin veren tarayıcılar gibi.
Bu ders sadece temel tarama aletlerini kapsar, ayrıntılar takip edilen konularda ele alınacaktır.

3.UYGUN TARAYICI NASIL SEÇİLİR?

"Moving Theory into Practice: Digital Imaging Tutorial (Teoriyi Uygulamaya Taşıma: Dijital Görselliştirme Rehberi)" kaynağına göre [kaynak] :
"Tarayıcı özelliklerini değerlendirmek zor olabilir ve genellikle standart eksikliği vardır, o nedenle anlamlı karşılaştırmalar yapmak olanaksızdır. [...] Mevcut tarayıcıların ayrıntılarını okurken, bunların büyük pazarlar için, örneğin büyük işletmeler ve grafik sanatları bölümleri gibi, tasarlandığını aklınızda tutun. Çok azı kütüphane ve arşivlerin özel ihtiyaçlarını karşılamak üzere tasarlanmıştır. Hedefiniz çok az ödün vererek, ihtiyacınıza en uygun olanı bulmak olacaktır."

Bazı tür tarayıcılar çok pahalıdır, küçük bir kurum için çok daha pahalıya mâl olabilir. Bazı aletler gerçekten çok akıllı ve hızlıdır ama bu son model aletleri kullanarak yapılacak pek çok şey (muhtemelen çok daha yavaş olarak) dijital kamera veya basit bir düz yataklı bir tarayıcı kullanılarak da yapılabilir. Kaynak yetersizliği durumunda başka seçenekler de mevcuttur, kullanılmış ekipman satın alabilir veya kendi ekipmanınızı kurabilirsiniz.
Şekil 1:DIY Book Scanner Introduction and Motivation from Daniel Reetz on Vimeo. [Daniel Reetz tarafından Vimeo da yayınlanan giriş düzeyinde kitap taramayla ilgili bir video, Ç.N.]
Uygun tarama aleti seçimiyle ilgili konular bu dersin sonraki bölümlerinde ele alınacaktır.

4.TARAYICI ALETLERİN TEKNİK ÖZELLİKLERİ

Tarayıcı ekipmanları ile ilgili temel sınıflamayı okudunuz, bu bölümde bu tür aletlerin teknik özelliklerini öğreneceksizin.
  • Renk derinliği/Tonlama Oranı
    • Tarayıcı en azından piksel başına 24bit ile başa çıkabilmelidir.
  • Çözünürlük oranı
    • Gerçek optik çözünürlük yerine üretici firmalar ara değer olarak eklenmiş çözünürlük (interpolated) kullanır, bu da genellikle optik çözünürlükten önemli ölçüde yüksektir. Ara değerli çözünürlük bilgisayar programları tarafından yapılır ve tarama aletinin yetenekleri hakkında aslında hiç bir şey söylemez. Tarayıcıların çözünürlük aralığı piksel yoğunluğu ile ifade edilir. 2009'da, en gelişmiş düz yataklı bir tarayıcı 5400 PPI'e (İnç başına piksel sayısı) kadar tarama yapabilmekteydi. Bu oldukça yüksektir, dijitalleştirme için 1000 ppi yeterlidir.
    • Dijital kameraların çözünürlüğü genellikle megapiksel ile ifade edilir. Megapiksel sayısı sadece dijital kamera seçimi ile ilgili bir faktör değildir, çok önemli bir konudur.
  • Görüntünün çıktı formatı
    • Tarayıcılar farklı formatlarda görüntü çıktıları üretebilir, kayıpsız (TIFF, BMP) ve JPEG gibi kayıplı formatlar. Görüntü daha sonra sıkıştırılabilir, o nedenle tarama süreci sonunda kayıpsız bir görüntü elde etmek çok önemlidir.
  • Medya (ortam) türleri
    • Tarayıcının yansıtıcı ve/veya şeffaf materyallerle çalışıp çalışamama durumu.
  • Tarayıcı yüzeyinin boyutu
    • Standart dışı dokümanlar taramak istediğinizde bu çok önemlidir.
  • Bilgisayara bağlı tür
    • Tarayıcıyı bilgisayara bağlamak için genellikle USB kablosu kullanılır.
  • Tarama hızı
  • Yoğunluk aralığı
    • Yüksek yoğunluk aralığı, tarayıcının bir taramada gölge ve parlaklık detaylarını üretebilmesi demektir.
  • Görev döngüsü/ömür boyu kapasitesi
    • Tarayıcı ne kadar uzun çalışabilecektir?
  • Standart uygulama programlama ara yüzü desteği
    • Kulağa korkutucu gelebilir ama çok kullanışlı bir özelliktir. Standart uygulama programlama ara yüzünü (application programming interface- API) destekleyen tarayıcı Adobe Photoshop gibi bilgisayar yazılımları ile doğrudan iletişim kurabilir. TWAIN API en çok kullanılanlardan biridir.
Bazı tarayıcılar Optik Karakter Tanıma (Optical Character Recognition) yazılımı gibi ek donanımla birlikte gelirler. Eğer metin içerikli bir doküman taranıyorsa, sadece taranan görüntü değil OCR'nin sonuçlarını da içeren bir PDF dosyası alabilirsiniz.
Bu teknik özellikleri öğrendikten sonra, aşağıdaki sorulara cevap aramanız tarayıcı seçerken yardımcı olacaktır. [kaynak]:
  • Çeşitli boyutları ( A4, A0), doküman türlerini (tek yaprak, ciltli), ortamı (yansıyan, şeffaf) işleyebilecek mi? Çok kötü durumdaki bir nesneyi bile taramak mümkün mü?
  • Bu tarayıcı, hedefimize uygun kalitede görseller üretebilecek mi?
  • Bu tarayıcı üretim takvimimi destekleyecek ve ödediğimiz paraya değecek mi? Yeterince hızlı ve kullanımı kolay mı?
  • Doküman işleme kapasitesi nedir?
  • İş zamanı, MTBF (Mean Time Between Failure-Arızasız Geçen Ortalama Süresi) ve ömür boyu kapasitesi nedir?
  • Ne tür bakım/servis hizmetleri mevcuttur (24-saat yenileme, servis)?
Tarayıcı alet seçerken, benzer bir kurumun deneyimine ve/veya dijitalleştirme projesine bakmak her zaman için yararlıdır.

DERSİN ÖZETİ

Bu derste dijital görüntü yapısı hakkında bilgiler edindiniz. Piksellerin rolü, görüntü çözünürlüğü, renk derinliği ve sıkıştırmanın ne olduğunu öğrenmiş olmanız lazım. 
Mevcut tarayıcı ekipmanlarının çoğu tanımlandı, farklı tarama ekipman türlerini ve bunların teknik özelliklerinin farkında olmanız gerekir. Ne tür bir içeriğin dijitalleştirileceğini bileceğiniz için dijitalleştirme planlarınızı gerçekleştirmek için gerekli uygun ve fiyatı makul ekipman seçebilmelisiniz.

Referanslar
  • Digital Image, Wikipedia [link]
  • "Moving theory into practice: The digital imaging tutorial", Cornel University Library [link]
  • Image Scanners, Wikipedia [link]
Formun Üstü
Formun Altı

Dijitalleştirme sürecinde kullanılan yazılım hakkında bilmeniz gerekenler?


İçindekiler

  1. Dijitalleştirme yazılımına giriş
  2. Ne tür yazılıma ihtiyacımız var?
  3. İleri işleme - grafik yazılım
  4. İleri işleme - ses ve video edit etme yazılımı
  5. Metin dokümanları/OCR yazılımları
  6. Web sunumu versiyonlarının oluşturulması
  7. Nesnenin dijital kütüphanede yayınlanması
  8. Dersin özeti

1.DİJİTALLEŞTİRME YAZILIMLARINA GİRİŞ

Bu dersin kapsamına giren yazılımlar (bilgisayarlarda çalışan uygulamalar/programlar) iki gruba ayrılabilir:
  • dijitalleştirme iş akışını sağlayan yazılımlar,
  • dijitalleştirme sürecini kolaylaştıran/hızlandıran/iyileştiren yazılımlar.
Bu temel bir ders olduğundan, ilk gruba giren araçlar daha önemlidir fakat dijitalleştirme sürecini hızlandırabilecek bazı uygulama örneklerini de göreceksiniz.

Her bilgisayar uygulamasının, bilgisayarın gücü, işletim sistemi, diğer uygulamaların mevcut olmasıyla ilgili kendine göre ihtiyaçları vardır, yazılımın etkin olarak kullanılması için bunların yerine getirilmesi gerekir. İstenen bilgisayar programını satın alma/kullanmaya karar vermeden önce, kendi bilgisayarınızın alt yapısında iyi çalışıp çalışmayacağına dikkat etmeniz gerekir. Çoğu yazılım satıcıları uygulamalarının ücretsiz deneme versiyonunu sunarlar, bu da satın almadan önce programı test etme olanağı verir.

Ticari mülkiyeti olan yazılımlardan başka oldukça fazla ücretsiz yazılım çözümleri de mevcuttur. Bazen bunlar satın alınanlardan çok daha avantajlı olabilir. Ücretsiz yazılım bazen kurulum ve etkili kullanım konusunda ek teknik bilgi gerektirebilir. Bir küçük bellek kurumunda gerekli beceriye sahip IT uzmanının eksikliği sorun yaratabilir. Ama yine de istenen iş için ücretsiz uygulama olup olmadığını araştırmak iyi olur, çünkü lisans ücretleri bazen çok yüksektir. O nedenle ücretsiz uygulamaların nasıl kurulup kullanılacağını öğrenmek için bir kaç dakika harcamaya değer.

2.NE TÜR YAZILIMA İHTİYACIMIZ VAR?

Dijitalleştirme yazılımı dijitalleştirme sürecinde çok önemli bir rol oynar. Dijitalleştirme iş akışında, örneğin web sunumu versiyonunun hazırlanması gibi, belirli aşamayla ilgili hedeflerin gerçekleştirilmesine yardımcı olur. Aşağıda sunulan liste, ilk derste bahsedilen dijitalleştirme iş akışının bütün aşamalarını ve bu aşamalarda gerekli olacak yazılım türlerini içerir. Çeşitli bilgisayar programları kullanışlı olabilir; Excel tablolarından (materyal listesi, sayfa sayısı, durumu ve yeri ile ilgili)  uzmanlık isteyen grafik yönetim araçlarına kadar.
  • Dijitalleştirme için nesnelerin seçimi
    • Elektronik kataloglama sistemi
    • İş Tablosu (Spreadsheet)
  • Nesnenin metadata'sını hazırlama
    • Elektronik kataloglama sistemi
    • İş Tablosu (Spreadsheet)
  • Tarama süreci
    • Tarama donanım sürücüleri
    • Tarama ekipmanlarını yöneten yazılımlar
  • İleri işlem
    • Grafik yazılımlar
    • Ses ve video edit etme yazılımları
  • Görüntülerden metin yakalama
    • Optik Karakter Tanıma yazılımları
    • Metin editörü – düzeltmeler için
  • Dijitalleştirilen nesnelerin web sunum versiyonlarını hazırlama
    • Sunulan dosyaların toplu işlenmesine izin veren grafik yazılımlar
  • Uzun dönemli koruma
    • Güvenli bir depolama aygıtına veya depolama hizmetine dosyaları vermeye izin veren istemci uygulaması
  • Nesnenin web’de yayınlanması
    • Dijital kütüphane yazılımı
  • Bütün sürecin ilerleyişini kaydetme
    • İş Tablosu
Kütüphane hedeflerini uygulamak için kütüphane katalogunun elektronik versiyonunun önemi kuşku götürmez. Elektronik katalog, dijitalleştirme iş akışında seçim sürecini önemli ölçüde hızlandırabilir. Kataloglar nesnelerin metadatası ile ilgili bilgiler tutarlar, bunlar da o nesnenin dijital versiyonu üretilirken metadata oluşturmak üzere kullanılabilir. Çeşitli Online Puclic Access Catalogue (OPAC veya basit anlatımıyla halkın kullanımına açık online kütüphane katalogu) sistemleri mevcuttur, fakat onları burada anlatmak bu dersin kapsamını aşar. En basit çözüm (bir sisteme ihtiyacınız olduğu düşünülerek) paylaşımlı bir online iş tablosu (örneğin Google Docs kullanılarak) oluşturmaktır, bu envanterinizin durumunu kaydetmeyi sağlayacaktır. Kütüphanenin sahip olduklarının envanterini güncel tutmak çok önemlidir ama dijitalleştirme iş akışında temel öncelik değildir.

Tarama sürecine gelince, her bir donanım sağlayıcı, tarayıcısıyla birlikte tarama sürücüsü (driver) sağlar. Donanım sürücüleri, kullanılan işletim sistemi/bilgisayar ile  tarama ekimpanının kullandığı dil arasında bir tür türcümandır. Sürücüler olmadan, verilen aleti kullanarak tarama yapmak olanaksızdır. Sürücülerden ayrı olarak, satıcılar genellikle tarayıcıdan resimleri almaya yarayacak ve temel grafik uygulamaları yapacak, örneğin kesme, döndürme gibi, bir yazılım da verirler. Tarayıcıların,TWAIN gibi genel programlama ara yüzleri ile uyumluluğu durumunda ek uygulamalara ihtiyacınız yoktur, uygun grafik araçlara sahip olmak yeterlidir. Genellikle seçenek yoktur, satıcının sürücülerini alıp kendi bilgisayarınıza kurmanız gerekir. Bazı durumlarda alternatif sürücü mevcut olabilir.

Bu dersin takip eden bölümlerinde, tarama süreci bittikten sonraki aşamaları yerine getirmek için yararlı olabilecek uygulamalar hakkında bilgiler okuyacaksınız. Bu aşamalar, kaliteli dijital kaynaklar yaratma açısından en önemli aşamalardır.

Web sunum versiyonunu hazırlamak gibi bazı aşamalar dijitalleştirilen materyalin türüne çok bağlıdır. Durağan (hareketsiz) görüntüler için farklı, filmler için farklı yazılım kullanacaktır. Dersin takip eden bölümlerinde her bir yazılım kategorisi tanımlanacak ve hem ücretsiz çözümler hem de ticari olanlar tanıtılacaktır.

Takip eden bölümlerde bazı dosya formatlarından kısaca bahsedilmektedir, lütfen bir sorunuz olduğunda sözlüğe bakınız. Dosya formatları hakkında daha ayrıntılı tartışma bu dersin ilerleyen bölümlerinde sunulacaktır.

3.İLERİ-İŞLEME - GRAFİK YAZILIMLAR

Grafik ileri işleme şunlar için uygulanır:
  • tarayıcı ayarlarındaki hataları düzeltme (bazen mümkündür),
  • görüntünün yönünü ayarlama
  • görüntüleri istenen formata çevirme
  • ve diğerleri

Ücretsiz yazılımlar

GNU Image Manipulation Program – GIMP, http://gimp.org/
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında: Fotoğraf rötuşu, görüntü kompozisyonu ve görüntü yazarlığı bildirme gibi görevler için ücretsiz dağıtılan bir programdır. Pek çok yetenekleri vardır. Basit bir çizim (paint) programı, uzman kalitede fotoğraf rötuşlama programı, görüntü formatı çevirici gibi kullanılabilir. GIMP büyüyebilen ve genişleyebilen bir programdır. Hemen her şeyi yapmak için eklentiler (plug-ins) ve uzantılarla genişletilecek şekilde tasarlanmıştır. Gelişmiş komut dizisi oluşturma ara yüzü, en basit işden en karmaşık görüntü üzerinde oynama işlemlerine kadar herşeyin kolayca yazılmasına izin verir, örneğin bilgisayarınızın ana belleğinden 100 tane görüntüyü yükleyebilecek ve bunların hepsini döndürebilecek bir komut dizisi yazabilirsiniz. GIMP, Photoshop’a ücretsiz bir alternatif olarak bilinir.

Şekil 1 Gimp uygulaması. Ekran görüntüsünün alındığı [kaynak].

Picasa, http://picasa.google.com/
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında:Picasa yazılımı bilgisayarınızdaki fotoğraflara bakmak, düzeltmek ve organize etmek için basit bir yol sunar. Picasa yazılımı fotoğraflarla ilgili en kullanışlı araçlardan biridir, kullanımı kolay ve oldukça da güçlüdür. Picasa bir takım temel düzeltmeler (kesme, düşleştirme, otomatik kontrast, renk düzeltme ve ayrıca kırmızı gözü azaltma gibi), ayarlama seçenekleri (renk sıcaklığı gibi) ve etkiler (siyah ve beyaz çevirimi gibi) sunar. Ayrıca coğrafi etiketleme ve toplu işlem gibi ek özellikler de sunulmaktadır.
  •  
  • Şekil 2: Picasa temelleri webinar'ı (web semineri).

    Inkscape,
    http://www.inkscape.org/
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında:Ücretsiz vektör grafikleri editörüdür, Adobe Illustrator veya CorelDraw’a benzer kapasitelere sahiptir. W3C standardı Scalable Vector Graphics (SVG) dosya formatı kullanır. Inkspace pek çok gelişmiş özellikleri destekler (imleçler, kopyalar, alpha blending, vs.) ve elverişli bir ara yüz tasarlamada çok iyidir. Düğüm noktası edit etme (nodes), karmaşık yol işlemleri, trace bitmaps ve daha pek çok özellikler sunar.
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında: "Baskıya-hazır” çıktılar hazırlamak ve sayfa düzenine yeni yaklaşımlar getirmek için kullanılabilecek ücretsiz bir programdır. Modern ve kullanıcı dostu arayüzü yanında Scribus, profesyonel yayıncılık özellikleri (CMYK renk desteği, ICC renk yönetimi) ve çok amaçlı PDF oluşturma desteği.
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında:Çakışan resimlerin serisini birleştirmeye izin verir. Hugin sayesinde, örneğin bir anıt gibi nesnenin ayrıntılı bir kaç resmini almak ve yüksek kaliteli detaylı bir fotoğraf oluşturmak için bunları birleştirmek mümkündür görüntüler.
Adobe Acrobat Reader, http://get.adobe.com/reader/
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında:PDF dosyalarını kolayca görüntülemeye ve yazdırmaya izin veren ücretsiz bir araçtır.
  • İşletim Sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında:Gsview basit (ama çok güçlü) uygulamadır, PDF ve PS dokümanlarının içeriğini görüntülemeye izin verir.

Ücretli yazılımlar
  • İşletim Sistemi: MS Windows, Mac OS X
  • Hakkında:Photoshop dijital görüntülemede endüstri standardı olarak kabul edilir, fotoğraflar üzerinde güçlüdür. Fotoğraf rötuşlama veya toplu işlem gibi özelliklere ihtiyacınız olduğunda Photoshop kesinlikle bunları yapabilir. Çeşitli özellikler sunar, çeşitli ek yazılım bileşenleri içeren farklı versiyonu sunulmaktadır; Adobe Lightroom.
  • İşletim Sistemi: MS Windows
  • Hakkında:Adobe Photoshop'a rakip olarak kabul edilir, biraz daha az fonksiyonlara sahiptir ama Adobe Photoshop'dan çok daha ucuzdur. Dijitalleştirme iş akışında grafik ileri işleme açısından yeterli özellikler sunar.

4.İLERİ-İŞLEME – SES VE VİDEO DÜZENLEME YAZILIMLARI

Bu kurs çoğunlukla hareketsiz görüntü ve metin içeren dokümanlarla ilgilidir ama ses ve video da çok önemlidir. Umarız aşağıda ilerideki projelerinizde yararlı olacak bazı araçlar bulabilirsiniz.

Ücretsiz yazılımlar

Audacity, http://audacity.sourceforge.net
  • İşletim sistemleri: MS Windows, UNIX, Mac OS X
  • Hakkında: Audacity ücretsiz, kullanımı kolay ve çok-dilde mevcut ses editörüdür. Canlı ses kayıtlarını, teypleri ve diğer kayıtları dijital kayıtlara veya CD'lere aktarmak, çeşitli ses dosyalarını düzenlemek (kesme, kopyalama, ekleme veya sesleri birbirine karıştırmak) için kullanabilirsiniz. Bütün özelliklerinin listesini bu adreste bulabilirsiniz: http://audacity.sourceforge.net/about/features.
OpenShot Video Editor, http://openshotvideo.com
  • İşletim sistemleri:UNIX
  • Hakkında: Doğrusal olmayan (non-linear) video editörüdür, Linux kullanıcıları düşünülerek tasarlanmıştır. OpenShot pek çok farklı video dosya formatını destekler, videolar oluşturmaya ve düzenlemeye, bunları ses dosyaları ile birleştermeye ve daha pek çok karmaşık şeye izin verir.
PiTiVi, http://pitivi.org
  • İşletim sistemleri:MS Windows, UNIX, Mac OS X
  • Hakkında: Linux kullanıcıları için zengin özellikli bir film editörüdür, diğer işletim sistemleri üzerine de kurulabilir. PiTiVi OpenShot'a benzer özellikler sunar fakat daha olgun bir üründür. Nasıl çalıştığını görmek isterseniz, Şekil 1'e bakın.
Figure 1 : PiTiVi iş başında.

VLC media player, http://www.videolan.org/vlc
  • İşletim sistemleri:MS Windows, UNIX, Mac OS X
  • Hakkında: Platformlar-arası bir multi-medya çalıcıdır (pazarlama sloganı; "Her şeyi çalar"). DVD'leri, (S)VCD'leri, Ses CD'leri, web akışları, TV kartları ve daha pek çoğunu çalabilir. Kurulum için bir düzine kod çözücülere ihtiyacınız yoktur. VLC içinde bütün kodlar vardır. Neredeyse mevcut bütün kod çözücüleri destekler. Dahası hasar görmüş dosya veya medyayı bile çalabilir. Eksik veya bozuk parçalar VLC'yi durduramaz, hâlâ kullanılabilir durumda olan video ve ses bilgilerini çalar.
  • İşletim sistemleri:MS Windows (Vista/7)
  • Hakkında: Microsoft web sitesinden indirilebilen ücretsiz bir yazılımdır. Video ve ses materyallerinin düzenlenmesine/karıştırılmasına (mix) ve bunların Windows Media Video (wmv) formatında yayınlanmasına izin verir.
  • İşletim sistemleri:MS Windows
  • Hakkında: Avery Lee tarafından yazılmış Microsoft Windows için bir video alma ve video işleme aracıdır. Linear video akışlarını işlemek için tasarlanmıştır, filtreleme ve yeniden sıkıştırma içerir.

Ücretli yazılımlar

  • İşletim sistemleri:Windows, Mac OS X
  • Hakkında: Eksiksiz, profesyonel bir araçtır, kaydetme ve karıştırma, ses içerikleri oluşturma ve düzenlemeye izin verir.
  • İşletim sistemleri:Windows, Mac OS X
  • Hakkında: Profesyonel video üretim ortamıdır, en gelişmiş araçlara erişiminizi sağlar.
  • İşletim sistemleri:Mac OS X
  • Hakkında: Profesyonel linear olmayan (non-linear) düzenleme yazılım uygulamasıdır, Macromedia Inc. ve sonra Apple Inc. tarafından geliştirilmiştir. Yazılım, kullanıcıların bağlanıp kendi hard disklerine (dahili veya harici) video almalarına izin verir, burada kullanıcı düzenleme, işleme yapabilir ve çok çeşitli biçimlerde çıktısını alabilir.

5.METİN DOKÜMANLARI/OCR YAZILIMI

Bu bölüm metne dayalı dokümanların oluşturulmasında yararlı olacak araçları tanıtır. En önemli Optik Karakter Tanıma (Optical Character Recognition - OCR) uygulamalarından bahsedilecektir ama daha öncede söylendiği gibi bu araçların performansı işlenen kaynağın türüne çok bağlıdır.

Ücretsiz yazılımlar

OpenOffice, http://openoffice.org
  • İşletim sistemi: MS Windows, UNIX, Mac OS X
  • Hakkında: OpenOffice çeşili araçlar içerir, bunlar iş tabloları (Calc), çizim uygulaması (Draw) and metin editörü- Writer. Writer aracı metin dokümanları oluşturmak/düzenlemek için kullanılabilir. Çeşitli dillere ait sözlükler içermesi sayesinde ORC işleminin sonuçlarını düzeltmek (yazım denetimi yapmak) için kullanılabilir.  PDF dokümanları da üretebilir.
Google Docs, http://docs.google.com
  • İşletim sistemi:herhangi bir sistem – modern web tarayıcı gerektirir, örneğin Firefox, Chrome gibi.
  • Hakkında: Metin dosyaları, iş tabloları ve sunumların oluşturulması, paylaşılması ve iş birliği yapılmasına izin veren online bir araçtır. Ayrıca kolayca online anketler oluşturulmasına izin verir, sonuçlar daha sonra çeşitli araçlar kullanılarak analiz edilebilir ve görselleştirilebilir. Google Docs çeşitli diller için kendi içinde bir yazım denetimi sunar, Internet'te dokümanları paylaşma kapasitesi sayesinde, aynı anda birkaç kişi bir doküman üzerinde çalışabilir.
Sun PDF Import Open Office Extension, http://extensions.services.openoffice.org/project/pdfimport

  • İşletim sistemi:MS Windows, UNIX, Mac OS X
  • Hakkında: Bir OpenOffice uzantısıdır (bilgisayarınızda OpenOffice'in yüklenmiş olması gerekir) PDF dokümanlarını almanızı ve düzenlemenizi sağlar. Bu bir metnin tarih, sayfa veya küşük bölümlerini değiştirmek için en iyi çözümdür.
PDFedit , http://pdfedit.petricek.net/en/index.html
  • İşletim sistemi:MS Windows, UNIX
  • Hakkında: Gelişmiş PDF dokümanları oluşturmaya izin verir, UNIX sistemleri için geliştirilmiştir ama MS Windows altında da çalışabilir.
Tesseract, http://code.google.com/p/tesseract-ocr/
  • İşletim sistemi:MS Windows, UNIX, Mac OS X
  • Hakkında: Tesseract OCR motoru, 1995'de UNLV Doğruluk testindeki top 3 motordan biridir. 1995 ve 2006 arasında üzerinde çok az çalışılmıştır ama hâlâ mevcut en doğru açık kaynak OCR motorlarından biridir. Şu anda Tesseract çoğunlukla Google tarafından desteklenmektedir.
OCRopus,http://code.google.com/p/ocropus/
  • İşletim sistemi:MS Windows, UNIX, Mac OS X
  • Hakkında: En gelişmiş doküman analiz ve OCR sistemidir, takılabilir (pluggable) sayfa düzeni analizi, takılabilir karakter tanıma, istatistiksel doğal dil modellemesi ve çoklu-dil kapasitelerine sahiptir. OCRopus gelişimi Google tarafından desteklenmektedir ve temel olarak yüksek verimlilik ve yüksek miktarda doküman aktarma çalışmaları için planlanmıştır.
FreeOCR,http://www.paperfile.net/
  • İşletim sistemi:MS Windows
  • Hakkında: Tesseract OCR motorunun ücretsiz öncüsüdür. Bir Windows yükleyicisi içerir, kullanımı çok basittir ve çoklu sayfa tiff, Adobe PDF ve faks dokümanları ile Tesseract motorunun kendi başına okuyamayacağı  sıkıştırılmış Tiff gibi görüntü türlerini açmayı destekler. Twain ve WIA tarama sürücüleri kullanarak tarama yapabilir.

Ücretli yazılımlar

  • İşletim sistemi:MS Windows, Mac OS X
  • Hakkında:Word, Microsoft Office paketinin bir parçasıdır. Metni düzenlemeye ve yazım hatalarını düzeltmeye izin verir. Ek bir plugin (eklenti) kurulduktan sonra PDF olarak dokümanı yayınlamaya izin verir.
  • İşletim sistemi:MS Windows, Mac OS X
  • Hakkında:Çeşitli lisanslar altında sunulmaktadır, en gelişmiş Optik Karakter Tanıma Yazılımıdır. ABBYY ayrıca bu yazılımın özel bir versiyonunu sunar, bu da FineReader XIX olarak adlandırılan OCR XIX yüz yıl gotik yazı fontlarına izin verir.
  • İşletim sistemi:MS Windows, Mac OS X
  • Hakkında:DjVu formatında dokümanlar oluşturulmasına izin verir, içindeki OCR 100'den fazla dili destekler. Ustalıklı kullanıcı ara yüzü sunar, ayrıca toplu işleme de desteklenmiştir.
  • İşletim sistemleri:MS Windows, Mac OS X
  • Hakkında: Adobe paketinin içindedir, PDF dosyalarının akıcı bir şekilde   idare edilmesine izin verir.

6.WEB SUNUMU VERSİYONU

Şu ana kadar anlatılan araçların çoğu, web sunumu versiyonlarını hazırlama kapasitesine sahiptir. Bu araçlardan farklı olarak, türevler - çeşitli web sunum versiyonları hazırlamak için yararlı olan yalızımlar da mevcuttur.
Önceki bölümlerde, toplu işlemeden kısaca bahsedilmişti, konu ilerlemeden bunun ne olduğunu açıklamak gerekir.Toplu işlem, bir takım dosyaları ve bunlar üzerinde yapılmasını istediğiniz işlemleri belirlemenize izin verir. Bu özellik büyük sayıda dosya ile uğraştığınızda çok gereklidir, dijital görüntülerden türev formlar yaratırken gerekli olabilir. 

Ücretsiz yazılımlar

  • İşletim sistemleri: MS Windows, UNIX
  • Hakkında: PDF dosyalarında saklanan dijital görüntüleri DjVu formatına çevirmeye izin verir. Bazı durumlarda DjVu sıkıştırma yöntemi sunar, bu PDF dosyaları içinde kullanılandan daha etkilidir, o nedenle PDF yerine DjVu dosyalarını göstermek daha makul olabilir. 
  • İşletim sistemleri: MS Windows
  • Hakkında:Ücretsiz PDF sanal yazıcısıdır, hemen her şeyi sanal olarak PDF dokümanına çevirmeye izin verir. Kurulumdan sonra ek bir yazıcı olarak görünür, doküman web'de yayımlanmaya hazır olduğunda bu ücretsiz PDF yazıcıyı kullanarak yazdırabilirsiniz. Sonucu dokümanın içeriğinden oluşan bir PDF dosyası olarak alacaksınız.  
  • İşletim sistemleri:MS Windows, Mac OS X
  • Hakkında:Zoomify, ağ üzerinde yüksek kaliteli görüntülerin çok çabuk sunulmasına izin veren çok ilginç bir çözümdür. Zoomify Express, normal sıradan JPEG dosyalarından Zoomify görüntüler oluşturmanıza izin veren ücretsiz bir uygulamadır. Zoomify içeriğinin örnekleri firmanın web sitesinde görülebilir website.
  • İşletim sistemleri:DOS, MS Windows, UNIX, Mac OS X
  • Hakkında:LAME en iyi MP3 kodlayıcı olarak kabul edilir, 1998 ortalarından beri geliştirilmektedir. LAME, web sunumu için uygun boyut ve kalitede MP3 dosyaları oluşturmak için kullanılabilir.
  • İşletim sistemleri:MS Windows
  • Hakkında:MPEG-4 kodlayıcıdır, çok etkilidir, kullanımı ve indirilmesi ücretsizdir. Bazı testler, MP3 versiyonundan %50 daha küçük dosyalar üretebildiğini söylemektedir. 
  • İşletim sistemleri:MS Windows, UNIX, Mac OS X
  • Hakkında:  Kayıt, aktarma ve ses ve video akışı için platformlar-arası tam bir çözümdür. Çok çeşitli ses-video dosya formatlarını destekler.
  • İşletim sistemleri:MS Windows
  • Hakkında: Güçlü bir görüntü izletici ve aktarıcısıdır, mevcut pek  çok dosya formatını destekler.
  • İşletim sistemleri:MS Windows, UNIX, Mac OS X
  • Hakkında: Bitmap görüntülerini oluşturma, düzenleme ve birleştirmeye uygun bir yazılımdır. Çok çeşitli formatlardaki (100'den fazla) görüntüleri okur, aktarır ve yazar; GIF, JPEG, JPEG-2000, PDF, PNG, SVG ve TIFF dahil. ImageMagick ayrıca görüntülerde tercüme, çevirme, aynalama, yönünü çevirme, kırpma yapabilir, görüntü rengini ayarlar, çeşitli özel efektler uygular veya metin, çizgi, çokgen, elips şekilleri çizebilir. Ayrıca komut satırı aracıdır (grafik kullanıcı ara yüzü olmayan).
  • İşletim sistemleri:MS Windows, Linux, Unix
  • Hakkında: OptiPNG bir  PNG iyileştiricisidir, görüntü dosyalarını bilgi kaybı olmadan daha küçük boyutlara tekrar sıkıştırır. Bu program ayrıca dış formatları (BMP, GIF, PNM ve TIFF) optimize edilmiş PNG'ye aktarır ve PNG doğruluğunu kontrol eder ve düzeltir.

7.NESNEYİ DİJİTAL KÜTÜPHANEDE YAYIMLAMA

Nesneyi (veya web sunum versiyonunu) ve onun metadata'sını dijital kütüphanede yayımlamak için bir dijital kütüphane yazılımına ihtiyacınız vardır. Kendi başınıza böyle bir yazılım edinmeniz gerekli olmayabilir, belki başka kurumların izin vermesiyle kendi nesnelerinizi onların dijital kütüphanesinde yayımlayabilirsiniz.

Bir sonraki konuda dijital kütüphane sistemlerinin listesi önemli olanların kısa tanımlarıyla birlikte sunulacaktır.

8.DERSİN ÖZETİ

Bu derste dijitalleştirme iş akışının farklı aşamalarında yararlı olabilecek bazı uygulamaları öğrendiniz.
Belirli türdeki materyalin dijitalleştirilmesi konusunda daha fazla pratik örnekler göreceksiniz. Bu uygulamaları kendi başınıza indirebilir, kurabilir ve deneyebilirsiniz.

Herhangi bir yazılımı satın almadan önce, kendi bilgisayar alt yapınıza nasıl uyacağınızı araştırmanız gerekir. Ayrıca bu yazılımı kullanacak yeterli teknik bilginiz olup olmadığını ve yazılımın ihtiyaçlarınızı karşılayıp karşılamayacağını bilmeniz gerekir.

Bazı durumlarda ücretsiz araçlar ticari olanlarla aynı özellikleri sunarlar ve dijitalleştirme işi için yeterli olabilirler.
Referanslar
  • TWAIN web sitesi [link]
  • GNU Image Manipulation Program – GIMP projesi web sitesi [link]
  • Picasa, proje web sitesi [link]
  • Inkscape, proje web sitesi [link]
  • Scribus, proje web sitesi, [link]
  • Hugin, proje web sitesi, [link]
  • Adobe Acrobat Reader, proje web sitesi, [link]
  • Gsview, proje web sitesi, [link]
  • Adobe Photoshop, proje web sitesi, [link]
  • Corel Paint Shop Pro, proje web sitesi, [link]
  • Audacity, proje web sitesi, [link]
  • OpenShot Video Editor, proje web sitesi, [link]
  • PiTiVi, proje web sitesi, [link]
  • VLC media player, proje web sitesi, [link]
  • Windows Movie Maker, proje web sitesi, [link]
  • Adobe Audition, proje web sitesi, [link]
  • Adobe Premiere, proje web sitesi, [link]
  • OpenOffice, proje web sitesi, [link]
  • Google Docs, proje web sitesi, [link]
  • Sun PDF Import Open Office Extension, proje web sitesi, [link]
  • PDFedit , project website, [link]
  • Tesseract, proje web sitesi, [link]
  • OCRopus, proje web sitesi, [link]
  • Microsoft Word, proje web sitesi, [link]
  • ABBYY FineReader,project website, [link]
  • Document Express (DjVu) proje web sitesi, [link]
  • Adobe Acrobat, proje web sitesi, [link]
  • PDF2DJVU, proje web sitesi, [link]
  • BullZipfree PDF yazıcı, proje web sitesi, [link]
  • ZoomifyExpress, proje web sitesi, [link]
  • Lame encoder, proje web sitesi, [link]
  • FFmpeg, proje web sitesi, [link]
  • Infranview,proje web sitesi, [link]
  • ImageMagick, proje web sitesi, [link]
  • OptiPNG, proje web sitesi, [link]


Kendi dijitalleştirme laboratuvarımı ne zaman kurmalıyım?


İçindekiler

  1. Dış kaynak kullanımı belki iyi bir çözüm olabilir?
  2. Dış kaynak kullanılarak neler yaptırılabilir?
  3. Vaka çalışmaları
  4. Dersin özeti

1.DİJİTALLEŞTİRME DIŞ KAYNAK KULLANIMI NE ZAMAN BİR ÇÖZÜM OLUR?

İlk derste kısaca bahsedildiği gibi dış kaynak kullanımının tek bir tanımını yapmak zordur. Bu terim çeşitli bağlamlarda tutarsızca kullanılmıştır. “Ancak, dış kaynak kullanımı genellikle bir işin dışarıdan bir sağlayıcıya sözleşme ile verilmesi olarak görülür" [kaynak].

Bildiğiniz gibi dış kaynak kullanımı endüstrinin çeşitli alanlarında yaygın olarak uygulanmaktadır. Dijitalleştirmenin çeşitli aşamalarında da kullanılabilir, özellikle tarama sürecinde ve görüntülerden metin alırken.

"Dış bir sağlayıcı kullanmanın anlamı, üçüncü bir partinin malzeme ve uzmanlığı kullanılabilecek demektir, proje çalışanları projenin kendi uzmanlık alanlarına giren yönleri üzerinde yoğunlaşabilirler. Bir dış ofis kullanıldığında, özel ve pahalı malzemelerin satın alınması ve bakımı proje tarafından yapılmayacak demektir. Pek çok proje, satın aldıkları malzemeleri tam aşınma payı bedeli kadar kullanmazlar ve bu da dijitalleştirme maliyetini artırır.

Dış kaynak kullanımının nedenleri başka şunlar olabilir:
  • kısa bir sürede büyük bir işin yapılacak olması;
  • özel malzemelerin aşırı maliyeti (örneğin ciltlenmiş sayı veya mikrofilm tarayıcıları gibi);
  • beceri veya deneyim eksikliği nedeniyle kurum içinde ihtiyaç duyulan kaliteyi sunamama;
  • projenin yer, alt yapı veya personel gibi mecburiyetleri kurum içinde dijitalleştirmeyi engelleyebilir; veya
  • çok büyük miktardaki gazete veya mikrofilm tarama, metni yeniden daktilo etme veya XML işaretleme gibi işler için başka ülkelerdeki bürolardan (daha düşük personel ücreti fiyatlarına yansımaktadır) yararlanabilirsiniz." [kaynak]
Gördüğünüz gibi dış kaynak kullanımı dijitalleştirme maliyetini gerçek anlamda düşürebilir ve stratejik avantaj sağlayabilir. Dış kaynak kullanımının bunları sağlayıp sağlayamayacağını anlamak için şu soruları sormanız gerekir:
  1. Temel becerileriniz üzerine yeniden yoğunlaşabilecek ve toplam maliyeti düşürmek için firmanın uzmanlığını kullanabilecek misiniz?
  2. Kendi beceriniz gelişecek ve projeyi tamamlama kapasiteniz iyileşecek mi?
  3. Başka türlü maliyetini karşılayamayacağınız, anahtar teknolojilere ve ekipmana daha çok erişiminiz olacak mı?
  4. Eskimenin (eski donanım/teknoloji/taşıyıcılarla uğraşırken ortaya çıkan sorunlar) getireceği risk ve maliyetini düşürebildiniz mi?
  5. İnsan kaynakları açısından ölçek ekonomilerini arttırdınız mı?
  6. Yetenekli personele erişiminiz arttı mı?
  7. Dış kaynak kullanımı harcamaları, masrafları ve genel giderler üzerindeki kontrolünüzü artırdı mı?"
Bu soruları yanıtlamanın yanında, sizi dışarıdan bir firmayı görevlendirmekten alıkoyacak nedenleri de aklınızda tutmanız gerekir. Bir kez daha Tanner’in kitabına başvuracağız “Dijitalleştirme Maliyetini Düşürme El Kitabı"  [kaynak].

"Kurum içi dijitalleştirmenin getireceği pratik avantajlar ve maliyet nedenleriyle dikkate alacağınız bazı şartlar vardır, şunlar gibi:
  • koleksiyonu taşımak zordur veya kurum dışına taşınamaz;
  • koleksiyon kötü düzenlenmiştir, envanteri yapılmamıştır veya materyal düzeyinde kataloglanmamıştır ve sürecin bir parçası olarak yeniden iyi bir şekilde düzenlenmesi gerekmektedir;
  • dijitalleştirmenin uzun bir sürede, oldukça küçük bir miktarlarda aşamalı olarak yapılması gerekmektedir;
  • orijinaller üzerinde çalışılırken, bunlar dış kaynak kullanımı yapılacak ortamda yeterince korunamayacaklardır;
  • dijitalleştirme görev ve hedefleri çok karmaşık ve çeşitlidir; ve/veya
  • işin miktarı çok küçüktür.
Kurum içi dijitalleştirme ünitesini kullanmak, kuruma ekipman ve iyi eğitilmiş personel kazandırır, ayrıca orijinal nesnelerin taşınması ve işlenmesi yakından kontrol edilebilir. Ayrıca eziyetli ve pahalı ihale ve satın alma sürecinden kaçınılmış olur.

Pek çok projenin kurum içinde yapılmasının bir diğer nedeni de personel zamanı, genel giderler ve dosya depolama gibi bazı sarf malzemeleri genellikle kurum tarafından karşılanabilmesi ve projenin maliyet faktörü olarak ortaya çıkmamasıdır, bu da dış kaynak kullanımından daha ucuz bir seçenek olarak görünür. Böyle bir senaryoda, bütün iç genel giderler kurum tarafından göze batacak derecede çok olduğunda dış kaynak kullanımı bir seçenektir."

2.NELER DIŞ KAYNAK KULLANIMIYLA ALINABİLİR?

Önceki bölümde öğrendiğiniz gibi dış kaynak kullanımı dijitalleştirilecek koleksiyon çok büyük olduğunda iyi bir çözümdür, son zamanlarda büyük ölçekli dijitalleştirme projeleri rağbet kazanmaktadır. Kültürel miras kurumlarına dijitalleştirme hizmeti verebilen şirketlere talep artmaktadır. "Gazete Dijitalleştirmede En Son Gelişmeler, Pazara Bakış " [kaynak] adlı eserinde Edwin Klijn, Hollanda Milli Kütüphanesinin dijitalleştirme hizmeti sunan şirketleri nasıl araştırdığını anlatır .
Araştırma, dijitalleştirme iş akışının şu alanlarındaki en gelişmiş uygulamalar hakkında sorular içerir :
  1. Dijital görüntüleme teknolojisi,
  2. Optik Karakter Tanıma (OCR),
  3. Bölgelendirme (Zoning) ve bölümleme,
  4. Metadata çıkarma,
  5. Arama yapabilme,
  6. Web sunum sistemleri.
Bu öğelerin her biri ticari bir şirket tarafından yapılabilir. Bu bölümde, Klijn’in yazısında sunulan en ilginç bulgular hakkında daha fazla bilgi edineceksiniz. “Araştırmaya katılanların çoğu kurum için sıkı kalite kontrol yöntemlerine sahip olduklarını bildirdiler; bazıları ISO 9001:2000 sertifikalı, bazıları Kalite Teminat Planları (Quality Assurance Plans) ve diğerlerinin de standart kalite kontrol yöntemleri mevcuttu " [kaynak].
Lütfen bunların gazete dijitalleştirmesine uygun örnekler olduğunu unutmayın, bahsedilen öneriler genel değildir .
Dijital görüntüleme teknolojisi;
  • Gazete dijitalleştirmesinde genellikle düz yataklı A0 veya A1 tarayıcılar kullanılır, bazı şirketler gazete dijitalleştirmesi için özel yapılmış büyük formatlı tarayıcılar kullanırlar .
  • Araştırılan firmaların çoğu, gazetenin ana kopyası için 300ppi taramanın yeterli olacağı konusunda aynı fikirdeydiler .
  • Dosya formatı açısından, sıkıştırılmamış TIFF dosyası genel olarak önerilen formattır .
    • TIFF’den ayrı, JPEG (kalite 10) veya JPEG2000 de araştırılan firmalar tarafından kullanılmaktadır .
  • OCR için renkli mi yoksa gri tonlamalının mı daha iyi olduğu konusunda bir fikir birliği yoktur.
  • " Sıklıkla uygulanan görüntü geliştirme teknolojileri; eğrilik düzeltme, leke giderme, döndürme, kırpma, görüntü netleştirme, beyaz arka planı dengeleme ve görüntü ayırmayı içerir." [kaynak]
  • Çoğu katılımcı JPEG formatını web sunumu için en uygun format olarak önermektedir. Ama PDF de ilginç ve iyi bilinen bir format olarak işaret edilmiştir .
Optik Karakter Tanıma - Optical Character Recognition (OCR)
Bildiğiniz gibi: "gazete sayfalarında arama yapılabilmesi için, sayfaların dijital görüntüleri makinece-okunabilir metinlere dönüştürmek zorunludur " [kaynak].
  • Araştırmaya katılanlar ticari yazılımlar yanında ücretsiz yazılım paketlerini kullanmaktadır, bazen OCR’yi geliştirmek için ek dil kaynakları kullanmaktadırlar, örneğin veri sözlüğü, terminoloji listeleri veya sözlükler .
  • OCR kalitesi çoğunlukla orijinal materyalin durumuna bağlıdır, eğer gazete hasar görmüş, kötü basılmış, farklı yazı stilleri veya karakterler kullanılmışsa OCR sonuçları da idealden çok uzak olabilir.
  • Klijn yazısında çok ilginç bir gözlemde bulunur “ OCR metninin kalitesi genellikle OCR yazılımının performansından çok orijinal materyalin durumu hakkında bilgi verir" [kaynak].
  • Katılımcılar 20’inci yüz yıl başına ait gazete dijitalleştirme projelerinde doğruluk oranını 700,000 gazete sayfası (kelime doğruluğu elle düzeltilmiş) için %99.8 ile 350.000 sayfa (karakter doğruluğu, düzeltme yok) için %68’e kadar değişik oranlarda bildirmişlerdir " [kaynak].
  • " Kitap ve dokümanlara ait tarihi metinler için doğruluk oranı gazeteler için verilenlerden daha yüksektir; gazetelerin özellikleri göz önüne alındığında bu şaşırtıcı değildir " [kaynak]. Çünkü gazetelerde metin pek çok sütuna bölünmüştür, çoğunlukla resim de içerir ve farklı yazı boyutları kullanılmıştır .
  • İşlenmemiş OCR (bazen “kirli” OCR olarak adlandırılır) kalitesi çok farklı olabileceğinden dolayı bazı firmalar gazete sayfası üzerinde en önemli bölümlerin örneğin ana manşetin veya ilk bir kaç paragrafın elle düzeltilmesinin daha iyi olabileceğini önermektedir [kaynak].
Zoning (Bölgelendirme) ve segmentation (bölümleme)
Zoning ve segmentation nedir? Zoning, OCR’den alınan sonuçların kalitesini iyileştirmeyi hedefler, zoning sırasında sayfa üzerindeki bütün yatay ve dikey çizgiler, metin blokları ve çizimler gibi öğeler incelenir. Bu sürecin en son elde edilen sonucu, orijinal sayfa kompozisyonunun kabaca yapısal tanımıdır. OCR sadece metin içeren kısımlara uygulanır. Son olarak tanıma bittiğinde, OCR sonuçları sayfa yapısı içine birleştirilir .
Zoning ve segmentation kullanımı sayesinde, gazetelere makale düzeyinde erişilebilir fakat bu süreç yarı otomatiktir. Otomatik sayfa düzeni kalitesi, ağırlıklı olarak gazetenin sayfa düzeninin tutarlılığına dayanmaktadır, o nedenle çoğunlukla elle kontrol etmek gerekir .
" Bir gazeteyi makale seviyesinde bölümlere ayırma (segmenting) zaman alıcı olabilir; araştırmaya katılan birine göre işleme hızı saatte 100 sayfa olarak tahmin edilmektedir. Bu orana göre Dijital Günlük Gazete Veri Bankası  (Databank of Digital Daily newspaper) projesi için 8 milyon gazete sayfasının tamamını sayfa düzeyinde bölümlemek, bir çalışanın 50 yılını alacaktır! " [kaynak].
Metadata alma (extraction)
Metadata alma, sayfa sayısı, yayın tarihi, ana başlık, kişi adları, şehir (isimlenmiş öğeler) gibi ek bilgilerin otomatik olarak alınmasını hedeflemektedir. Bu otomatikleştirilmiş bir süreç olduğundan, sonuçların kalitesi daha çok sayfa yapısındaki düzensizlik derecesi ile belirlenmektedir.
Aranabilirlik ve web sunum sistemleri
OCR motorundan alınan makinaca okunabilir metin, arama sonuçları kalitesini önemli ölçüde artırabilir (sadece metadata arama ile karşılaştırıldığında). Bu yeni olanakları kullanmak için uygun arama motoru kullanılması gerekir.
Genellikle arama yetenekleri, dijital kütüphane yazılımı içinde yapılandırılmıştır, bu tür yazılım özel hosting (ev sahipliği) ve dijital kütüphane bakımı için bazı IT becerileri gerektirir. Ayrıca bu tür hizmetler de dış kaynak kullanımına tabii olabilir.
Depolama
Edwin Klijn'in “Gazete Dijitalleştirmede En Son Gelişmeler, Pazara Bakış" [kaynak] adlı eserinde kısaca bahsettiği bir diğer konu, dijital ana kopyaları depolamak için gerekli depodur. 300ppi sıkıştırılmamış TIFF görüntüsünün ana bellekte işgal ettiği yer (26MB) çok çarpıcı değildir ama gazetedeki sayfa sayısı ile çarpıldığında çok hızlı büyüyebilir. Dijital ana kopyayı emniyete almaya uygun çeşitli çözümler mevcuttur, DVD ve USB sabit disklerden başlayıp profesyonel veri ambarlarına kadar gidebilir. Her bir taşıyıcının (depo aygıtının) kendi yaşam ömrü olduğu unutulmamalıdır ve uzun süreli erişim sağlamak için periyodik olarak dijital ana kopyanın yeni taşıyıcılara aktarılması gerekmektedir. Veri, profesyonel veri ambarlarında saklandığında sadece yıllık bir ücret ödersiniz ve taşıyıcılar arasında aktarılmasından endişe etmenize gerek yoktur.
Özet
Dış kaynak kullanımı, proje çalışanların proje içinde kendi uzmanlık alanlarına yoğunlaşmalarına izin verir ama dış şirketten alınan sonuçlar hatalara karşı dikkatle incelenmelidir. Sizin yine de ne olup bittiğini bilmeniz şarttır.

3.ÖRNEK OLAY ÇALIŞMALARI

Sunulan örnek olay çalışmaları şu kaynaklardan alınmıştır:
  • Dış Kaynak Kullanımı - "İngiltere Milli Kütüphanesi (British Library) Örneği" - "Dijitalleştirme Maliyetini Düşürme El Kitabı" by Simon Tanner [kaynak]
  • Dış Kaynak Kullanımı - "Port Townsend Halk Kütüphanesi Örneği" - Washington State Kütüphanesi : Dijital En İyi Uygulamalar [websitesi]

Örnek Olay : The British Library


"İngiltere Milli Kütüphanesinin 2 ana dijitalleştirme projesi vardır, dijitalleştirme için dış kaynak kullanımı konusunda temel konuları belirler. Bu projeler şunlardır:
  1. Arşiv Ses Kayıtları (Archival Sound Recordings) [website] - Bu proje, farklı ve benzersiz koleksiyonlardan, 12.000 bölüme ayrılmış, toplamda 3.900 saatlik ses kayıtların kodlamasını yapmaya çalışmaktadır.
  2. 19'uncu Yüz Yıl İngiliz Gazeteleri (19th-Century British Newspapers) [website] - 1800 -1900 arası İngiltere gazetelerinden 2 milyona yakın sayfa, toplamda yaklaşık 10 milyar kelime.
Her iki proje de, dijitalleştirme öğeleri için (sesin kodlanması ve mikrofilm üzerindeki gazetelerin taranması) dış kaynak kullanmıştır. Bu tür işler için İngiliz Milli Kütüphanesi kurum içinde beceri ve uzmanlığı sahip olsa da, işin büyüklüğü, pahalı ekipman ve projelerin bitirilmesi için verilen sıkışık bitirme süresi nedeniyle dijitalleştirme için dış kaynak kullanmaya karar vermişlerdir.
Dış kaynak kullanımının da kendi içinde başa çıkılması gereken zorlukları vardır, özellikle sağlama/temin etme aşamasında, ama İngiliz Milli Kütüphanesi her iki durumda verdiği paranın önemli ölçüde karşılığını almış ve dış kaynak kullanımında yüksek verimlilik sağlamıştır. Gazete projesinde sınır ötesi (offshore) tarama, OCR ve bazı içeriğin yazılması ile yapılmıştır. Ses projesinde büyük miktardaki materyalin dönüşümü için uzman bir dış firma ile çalışılmış, bu sayede Kütüphane dahili temel becerilerine, Entelektüel Mülkiyet Haklarının zorlu konularına, içerik seçimine ve tanımlayıcı metadata işlerine yoğunlaşmıştır."

Örnek Olay Çalışması: Port Townsend Halk Kütüphanesi

Proje, yerel tarih kayıtlarını ve güncel olayları tutan, toplum hayatında önemli yeri olan Port Townsend Leader gazetesinin dijitalleştirilmesini hedeflemiştir. Metadata indekslemeyle birlikte gazete makalelerinin  dijital görüntüsüne Internet erişimi, vatandaşların bu zengin tarihi kaynağı kullanabilmelerini büyük ölçüde artırmaktadır.
Proje hakkında bazı önemli durumlar:
  • Pilot proje için seçilen yazılım paketi, Washington Üniversitesinin (University of Washington - UW) CONTENT veritabanıydı.
  • Gazetenin basılı versiyonları ciltliydi ve kötü durumdaydı.
Bir kaç on yıllık gazete zaten mikrofilme alınmış durumdaydı, o nedenle proje kağıt kopyaları yeniden ele almak yerine, mikrofilm görüntülerinin dijital formata dönüştürülmesinin fizibilitesini test etmek için tasarlandı. Proje, olası iki tarama senaryosunun test etmek, maliyet ve görüntü kalitesini karşılaştırmak üzere planlandı:
  • yerel bir firma tarafından (yani Seattle) taranmış, yerel tarih derneğinden mikrofilm pozitif kopyasını kullanma,
  • ve mikrofilm negatifleri doğrudan Bell & Howell'den sağlanmış ve ve OCLC'nin Koruma Kaynakları (Preservation Resources) tarafından taranmış
Bu proje için plan mikrofilm taramasının dış kaynak kullanılarak yapılmasıydı. Hedef TIFF4 formatında görüntüler oluşturmaktı, firma bunları CONTENT programı tarafından gerekli görünen GIF veya JPEG görüntülerine dönüştürecekti. Çünkü Morning Leader'ın sayılarının iç sayfaları tarihsiz ve sayfa numarasızdı, her görüntünün tarih ve sayfa sayısını gösterecek şekilde etiketlenmesini istedik.
Bu, projenin en çokzaman alan ve problem yaratan durumuydu. Sonunda, görüntü kalitesini ve yükleme kolaylığını karşılaştırmak amacıyla  "altın standardında" firmadan ve yerel bir firmadan örnek taramaları tercih ettik.

Yerel firma deneyimi: Reference USA iş rehberinden (kütüphanede online olarak Eyalet Çapı Veritabanı Lisanslama programı çerçevesinde mevcuttur) olası firmalar listesini aldır. Şirket tanımı ve çalışan sayısına dayanarak, Northwest Center Document Management of Seattle şirketinden fiyat kotası almak üzere iletişime geçtik. Örnek taramalar için müze mikrofilminin bir kopyası gönderildi, taramalar elektronik posta eklentisi olarak kütüphaneye geri gönderilebilecekti. Maalesef JPEG dosya dönüştürme programı Port Townsend Kütüphanesi bilgisayarlarında mevcut yazılımla açılamadı. NW Center ve UW CONTENT yönetici personeli ile yapılan bir kaç görüşmeden sonra görüntüleri yeniden boyutlandırmak ve dosya formatını degiştirmek için Adobe PhotoShop 5.5 yazılımını almaya karar verdik. Maalesef JPEG görüntüleri hala yazılımla uyumlu değildi. Sonunda en iyi hareketin TIFF görüntüleri yaratmak olduğuna karar verdik, bunlar PhotoShop içindeki "toplu eylem - batch action" ile JPEG'e çevrilebileckti. Aynı zamanda diğer yerel firma ile iletişime geçtim, ne yanıt verdi ne de isteğimi takip ettiler.
Northwest Center'deki personel tarama işini yapmak için çok uğraştılar; sorun onların kullandığı görüntü yazılımının genel kullanılmayan bir yazılım olmasıydı. Bütün bu süreç çok zaman aldı, çünkü mikrofil postada gitti, geldi, araya tatil girdi gibi. Sorunları daha da karmaşıklaştıran, müze müdürünün deneme taramaları yapmak üzere ihtiyaç duyulan süre için Jefferson County Historical Society kütüphanesinden ödünç mikrofilm vermeye gönüllü olmamasıydı. Sonunda kütüphaneler arası ödünç verme yoluyla Washington State kütüphanesinden film ödünç aldık.

Eyalet dışı firma: UW'de Dijital Projeler Koordinatörü olan Geri Bunker Ingram'ın önerisi ile OCLC'nin bir bölümü olan Preservation Resources in Bethlehem, Pennsylvania (genellikle PresRes olarak bilinir) ile iletişime geçtim. Bu, kütüphane materyallerinin dijitalleştirilmesinde daha çok deneyimi olan bir kurumdur ve onlar mikrofilm kaynağının ve dijital ürünün özellikleri ile ilgili uzun bir soru formuyla sürece başladılar. Fiyat kotalarının DW Center'a göre oldukça yüksek olması sürpriz olmadı. PresRes temsilcileri ile yapılan görüşmelerde, Bell & Howell'den temiz bir mikrofilm negatifi satın almaya karar verdik ve bunu PresRes'e gönderdik ve bize gazetinin sayılarından örnek bir tarama sağladılar.

PresRes'in taradığı negatif filmden görüntülerin kalitesi yerel mikrofilm pozitiflerinden gelene göre çok daha yüksekti." [kaynak]

4.DERS ÖZETİ

Bu derste dış kaynak kullanımı hakkında oldukça çok bilgi edindiniz. Dış kaynak kullanımının en önemli avantajlarını biliyorsunuz, bunlar [kaynak]:
  • Pahalı ekipman satın alıp bakımını yapmak için para bulmak zorunda değilsiniz - üstlenici firma ekipman ana maliyetinden sorumludur
  • Yeni personel almanız veya mevcut personeli eğitmeniz gerekmez - üstlenici firma işletimcileri kiralamak ve eğitmekten sorumludur. 
  • Projeyi yürütmek için kurum içinde insanlar ve makinalar için büyük alanlar açmanız gerekmez.
  • Dijitalleştirme konusunda derin bilgiler edinmeniz gerekmez (ama sonuçların kalitesini kontrol etmek için biraz bilgi gerekir).
  • Eğer yüklenici işten tasarruf sağlayan teknolojilere sahipse ve iyi ölçek ekonomileri elde edebilecekse, kurum içi dijitalleştirmeden daha ucuza gelebilir.
  • Daha yüksek kaliteli ekipman ve çok deneyime sahipse, yüklenici daha kaliteli bir sonuç elde edebilir.
  • Maliyet ve zaman konusunu iyi tayin etmelisiniz, böylece yüklenici iş akışını iyi anlayacak ve sizinle buna göre anlaşma yapacaktır.
Fakat dijitalleştirmede dış kaynak kullanımının dezavantajlarının da farkında olmalısınız [kaynak]:
  • Dijitalleştirme ve (metin, görüntü) alma konularında kurumsal bilgi veya kapasite geliştirmezsizin.
    • Dijitalleştirme giderek çok daha fazla önem kazınırken, kendi dijital becerilerinizi geliştirmek istemeniz çok muhtemeldir, o halde neden bugün başlamayasınız? 
  • Tatmin edici derecede kaliteli dijital içerik sunmak için dışarıdan insanlarla çalışmanın getirdiği riskler vardır
  • Baştan sona dışarıdan bir yüklenici ile iş yapabilmesi için kurum içinde birinin dijitalleştirme sürecini iyi anlaması gerekecektir
·          
    • Bu teknik terminolojiyi, kabul edilen teknik şartnameyi ve kalite kontrol ölçümlerini anlamayı içerir.
  • Yüklenici sizin zaman çerçevenize uyamayabilir.
  • Yüklenici, kurum içinde dijitalleştirmenin maliyetinden daha fazlasını sizden isteyebilir.
  • Faturayı imzalamadan önce, yüklenicinin yaptığı işin kalitesinden emin olmak için kendi dahili kalite kontrol denetiminizi yapmanız gerekir. 
  • Eğer dışarıya çıkmalarına izin veriliyorsa, değerli materyaller için taşıma ve sigorta işlerini ayarlamanız gerekir.
  • Eğer materyaliniz kurum dışına çıkacaksa, bunun bazı riskleri olabilir.
Bu ipuçlarından başka, JISC Dijital Medya Blog "Dış Kaynak Kullanımı mı yoksa Kurum için Dijitalleştirme mi?" [link] yazısı, dışarıdan bir dijitalleştirme hizmeti kullanıldığında dikkat edilmesi gereken 7 önemli şeyi sunar.
  • Açık/net sözleşmeler hazırlayın
    • Kurumunuzun yüklenici ile açık ve net bir sözleşme yaptığından emin olun. Zaman çerçevesi, maliyetler ve beklentiler açıkça belirtilmiş olmalıdır. Eğer dijitalleştirme işi daha önce iş yapıp memnun kaldığınız ve iyi ilişkiler geliştiğiniz bir kurumlarla yapılacaksa, sadece bir 'centilmenlik anlaşmasına' güvenmeyin. 
  • Önceki çalışmalarına bakarak bir hizmet sağlayıcı seçin
    • Bir yüklenici seçerken, yaptıkları işlerden örnekler ve önceki müşterilerinin listesini isteyin. Önceki müşterilerinden birkaçıyla görüşün ve deneyimlerini öğrenin. En ucuzun en iyi olmak zorunda olmadığını unutmayın; karar verirken sadece fiyat ve zaman faktörünü temel almayın. 
  • Neyin dijitalleştirileceğini açık şekilde belirtin
    • Eğer materyalin türü ve aralığı başlangıçta tartışılmamışsa, final maliyet tahmin edilenden çok daha fazla olabilir. Örneğin, benzer boyutlardaki fotoğraf koleksiyonunun taranması kolayca yapılabilir ama büyük boyutlu veya kaplanmış fotoğrafların dijital olarak fotoğraflanması kolay olmayabilir.
  • Dış kaynak kullanımında diğerleri ile iş birliğini düşünün 
    • Genellikle dış kaynağa ne kadar çok iş verirseniz oran o kadar ucuzlar. Bazı şartlarda, gönderilecek materyalin sayısını artırmak için başka kurumlarla birlikte çalışmak karlı olabilir. Ancak bunun dikkatle yönetilmesi gerekir ve bütün katılımcıların dijitalleştirme için ortak stantartlar üzerinde anlaşması gerekir. 
  • Kalite güvencesi
    • Bütün iş bitmeden önce mutlaka örnekler görün, kalite güvencesi yöntemi geliştirin ve yapılan işi kontrol etmek için zaman ayırın. 
  • Metadata'yı unutmayın
    • Metadata üzerinde biraz düşünmeniz gerekir, özellikle teknik olarak metadata. Yükleniciye bunu da kaydettirecek misiniz? Eğer metadata dijitalleştirme sırasında yapılmayacaksa, daha sonra üretmek zor olabilir. Diğer tür metadata işini de (örneğin metin transkripsiyonu) dış kaynak kullanımıyla yaptırmayı düşünebilirsiniz.
  • Kısmi dış kaynak kullanamını düşünün
    • Ya hep ya hiç durumu söz konusu değildir. Sadece dijital yakalama işi veya metadata girişi için dış kaynak kullanabilirsiniz. Bu genellikle az miktarda hassas materyaller olduğunda genel olarak yapılmaktadır.
Referanslar
  • Outsourcing, Wikipedia, [link]
  • "Handbook on Cost Reduction in Digitisation", Robert Tanner, [link]
  • "The Current State-of-art in Newspaper Digitization, A Market Perspective", Edwin Klijn [link]
  • "The case of Port Townsend Public Library" - Washington State Library : Digital Best Practices [link]
  • "To Outsource or to Digitise In-house?", JISC Media blog [link
Formun Altı