TARAYICI
Tarayıcının Çalışma Prensipleri
TARAYICI
Bir tarayıcı fotoğraf gazete kupürü gibi resim veya grafikleri sayısallaştırabilmenizi sağlar. Eldeki resim ışığa duyarlı yarıiletken elemanlar (LDR’ler) tarafından taranır. Bu elemanlardan alınan işaretler RAM’a yazılacak byte dizileri haline getirilir. Dizi buradan ekrana aktarılır veya bir dosyaya saklanır.
Bir tarayıcıyı kullanmak için tarayıcı tarafından okunan bilgiyi PC’ye aktaracak özel bir arabirim kartına ihtiyaç vardır. Bu da genellikle 8 bitlik bir kart olduğundan bir kısa genişleme yuvası tarayıcı kurmak için yeterli olacaktır. Farklı tarayıcı üreticileri tamamen farklı veri aktarma yöntemleri kullanmaktadırlar. Bu nedenle tarayıcıyı başka bir üreticinin ara birim kartıyla çalıştırmak mümkün değildir. Bu durumda tarayıcının bağlacının (connector) arabirimine uymadığını da gözle görürsünüz.
Bir çok tarayıcı ara birim kartı DMA (Direct Memoıy Access / Doğrudan Bellek Erişimi) sistemini kullanır Bunun anlamı kartın tarayıcının gönderdiği bilgiyi ayrılan bir bellek alanına yerleştirmesidir. Çalışan yazılım daha sonra veriye bu alandan erişir. Bir çok arabirim kartı bir atlama (jumper) ayarlaması ile DMA kanalının seçilmesine izin verse bile genellikle varsayılan (default) ayarın değiştirilmesine gerek kalmaz.
Bir çok kart üreticisi tarafından doğru şekilde ayarlanmıştır. Eğer sisteminiz tarayıcınızı kurduktan sonra DMA çakıştırılmasıyla karşı karşıya kalırsa tarayıcı kartınızdaki ayarlarda bir başka DMA kanalını seçmelisiniz. Ne yazık ki bu işlem tarayıcıya bağlı olarak değişir. Bu nedenle varsayılan konfigürasyonu değiştirmeniz gerekirse tarayıcıyla verilen dokümanı okuyunuz. Eğer kartı hangi konfigürasyonda çalıştırmanız gerektiğinden emin değilseniz çekinmeden değişik ayarları deneyiniz. Ancak bir değişiklik yapmadan önce mevcut ayarları bir kenara yazmayı unutmayınız.
Genellikle ikinci bir anlatma ayarı da tarayıcı kartının bağlantı noktası (port) adresinin seçilmesini sağlar. Yine, varsayılan ayarlar genellikle doğrudur. Sadece eğer sisteminizde bir ağ kartı veya bir modem kartı gibi çakışma yaratabilecek genişleme kartları varsa bu kartlardan birinin bağlantı noktası ayarını değiştirmeniz gerekebilir.
Genellikle eski tarayıcı sistemlerini kullanmak için hazırdaki bir donanım kesmesi (IRQ) gerekir. Bu durumda 8-bitlik bağdaştırıcı kartlarıyla problemler yaşayabilirsiniz. Buradaki Problem ek bağlantı noktalan yerleştirirken karşılaşılanın aynısıdır. 8-bitlik bir yuvada sadece 8 IRQ kullanılabilir ve bunlar genellikle halen kullanılıyordur. Çakışma genellikle ya olması gerektiği gibi IRQ7’yi veya diğer durumlarda IRQ5’i kullanan yazıcı arabirimiyle olur. Öyle ise tarayıcımızı yazıcı arabiriminin kullanmadığı bir kesmeye ayarlamalısınız. Eğer elinizde hangi kesmelerin kullanıldığını gösteren bir test programı yoksa önce IRQ5’i denemenizi öneririz.
Ayrıca tarayıcımız belki ikinci seri bağlantı noktasının (COM2) kullandığı IRQ3 kesmesini paylaşarak da çalışabilir.
Bir kartın bağlantı noktası adresini, DMA kanalını veya bir IRQ değiştirdiyseniz yeni ayarlan aktifleştirebilmek için kullanmakta olduğunuz yazılımın tamamını yeniden yüklemek veya yeniden düzenlemek zorunda kalabilirsiniz. Özellikle ağ kartlarındaki değişiklikler karmaşıktır. Bu durumda bütün ağı yeniden kurmanız gerekebilir. Bunun için ağ kartında bir değişikliği ancak diğer kartların ayarlarıyla oynayarak, ki burada söz konusu tarayıcı kartıdır, problemi çözemiyorsanız yapın.
Kaliteli bir tarayıcı seçmeden önce DPI ve gri seviyesi terimlerini anlamanız gerekir. Bu terimleri aşağıdaki örnekle açıklayanız.
Diyelim ki 10*10 inch (24.5 * 24.5 cm) boyutlarında bir resmi 800 DPI (Dost Per Inch / Inch Başına Düşen Nokta) çözünürlükte ve 256 gri seviyesi ile taramak istiyorsunuz. Bunu yapmak için 64 MB boş belleğe ihtiyacınız olacaktır. 256 gri seviyeli bir görüntü piksel (dot) başına bir bayt gerektirir. Böylece yukarıda bahsedilen resim toplam 64 milyon (8000 * 8000) pikselle taranacaktır.
Eğer bu resmin bu çözünürlükte bir baskısını istiyorsanız yazıcınızın 256 gri seviyeyi gösterebilmesi için her piksel başına 16 * 16’lık bir matrisi basabilmelidir. Bu gereklidir çünkü yazıcılar gri seviyeleri ancak değişen sıklıkta noktalar basarak oluşturabilirler. 300 DPI çözünürlüğü olan bir lazer yazıcı dahi kullanılsa ortaya çıkan baskının eni ve boyu 8000 * 16 /300 veya yaklaşık 430 inch (10 metre) olurdu.
Sonuçta çıktınız 100 metrekare bir alanı kaplardı ve 1970 sayfa tutardı. Dakikada 4 sayfa baskı hızında bütün resmin basılması sekiz saatten fazla sürerdi.
Yukarıdaki örnekle anlatmaya çalıştığımız gibi iyi bir tarayıcı ille de müthiş çözünürlüklerle veya gri seviyelerle karakterize edilmez. Bir tarayıcı bu yeteneklere sahip olsa bile PC sisteminden beklentileri PC’nin boyunu aşar. Bu yetenekler ancak posta pulu büyüklüğünde resimler sayısallaştırıp sonra büyütecekseniz yararlı olabilir. Birçok durumda 300 DPI çözünürlükte ve 16 gri seviyeli bir tarayıcı yeterli olmaktadır. Bu çözünürlükte mümkün olan sonuçlan düşünürseniz hiç gri seviyesi olmayan (siyah beyaz) bir tarayıcıya da karar verebilirsiniz.
İyi bir tarayıcının göstergelerinden biri de tarayıcıyla birlikte gelen yazılımdır. Genellikle bu bir tarayıcının en moral bozucu özelliğidir. Sıklıkla yazılım uzatılmış (extended) bellek kullanamaz, veya taranan resmin belli kısımlarını sabit diskinizde saklayamaz.
Bu programlarla kullanılan alışılmış belleğin sınırlı olması nedeniyle oldukça küçük resim formatları taranabilir. Bunun için tarayıcıyla birlikte gelen yazılımın üreticinin reklamlarında söylediği performansı gösterip göstermediğini her zaman belirlemelisiniz.
Bazı el tarayıcılarının yararlı bir aksesuarı da dokümanları düzgün bir doğru takip ederek taramanızı sağlayan kılavuz cetvelidir. Bu basit alet görüntü kalitesini önemli ölçüde arttırmaktadır.
Yakın bir zamana dek çok fazla kullanılmayan tarayıcılar, özellikle multimedia, yayıncılık ve tasarım gibi uygulamaların gelişmesine paralel olarak hızla yayıldı Klavye, fare vb. veri giriş aygıtlarıyla, metinleri, harfleri ve rakamları bilgisayara aktarmak mümkündür ama, görüntüler söz konusu olduğunda klasik veri giriş yöntemleri işe yaramaz. Giderek görüntülerin de standart veri türleri arasına girmesi ve PC’lerde grafik ortama geçilmesi, tarayıcıları yaygınlaştırdı. Tarayıcıların daha önceden, bugünkü kadar popüler olamayışlarının bir sebebi de, taranmış görüntülerin bellekte çok fazla yer tutmasıydı. Bir kitap dolusu metin, sabit diskinizde (kitabın boyutlarına göre) 100 ya da 300 KB’lık yer kaplarken, taranmış bir görüntü 5-10-20, bazen 50 MB (resmine göre!) yer tutabiliyor.
Tarayıcıların çalışma ilkeleri basittir. Taranacak nesne (kağıt), üst tarafından alta doğru satır satır ışığa duyarlı elektronik elemanlar tarafından taranarak sayısallaştırır. Tarayıcının daha iyi yapılabilmesi için nesne, bir ışık kaynağı ile aydınlatılır. Taranması istenen görüntü, üzerinden ışık kaynağı geçtikten sonra bir mercek aracılığıyla, fotoelektrik hücrelerden oluşmuş bir görüntü algılayıcı (image sensor) üzerine düşürülür. (Yani, ışık değerleri ölçülür, ölçüm değerine göre bir voltaj değeri üretilir.) Değişen voltajlarda elektrik impals üreten bu algılayıcı, daha ışıklı ve daha açık tonlardaki desenleri yüksek voltajla, koyu desenleri ise düşük voltajla gösterir. Analog voltaj sinyali, bir tür modem gibi işleyen analog-sayısal dönüştürücü yongası ile sayısallaştırılarak PC’nin belleğine aktarılır. Sinyaller, görüntü dosyası formatında disk ortamına kaydedilir. Daha sonra bu dosya üzerinde görüntü programları ile işlem yapabilirsiniz...
Tıpkı monitörler ve lazer yazıcılar gibi, tarayıcılarda da görüntüler çok küçücük noktalardan oluşur. Yani aynı şekilde, birim alana düşen nokta sayısı ne kadar yüksekse, elde edilen görüntü o kadar kaliteli olacaktır.
Günümüzde profesyonel yayıncılıkta kullanılacak bir tarayıcının çözünürlüğü en az 2400 dpi olmalıdır. Multimedia gibi uygulamalarda ise, taranan resimler basılmayacağı, sadece ekranda görüneceği için daha düşük çözünürlükle yetinilebilir.
Tarayıcılar, sadece çözünürlüklerine göre değil, algılayabildikleri renk sayısına göre de farklılık gösterirler. Renkli görüntüler bilgisayarda çok daha fazla yer tuttuğu için, genellikle ve sıkıştırma programları da kullanılır.
Profesyonel olmayan uygulamalarda, daha küçük boyutlarda olan el tarayıcıları kullanılabilir. Sayfa üzerinde gezdirilerek kullanıldıkları için el tarayıcılarının küçük bir üstünlükleri vardır: Bir kitaptan bir görüntüyü taramak istediğinizde, sayfayı yırtmak yada kesmek zorunda kalmazsınız... Ayrıca ucuz ve pratiktirler. Masa üstü tarayıcıları ise, tıpkı fotokopi makinesi gibi kullanmak zorundasınız.
0CR (Optical Character Recognition) Optik Karakter tanıma
Tarayıcıların getirdiği yeni bir olanak, görüntüler gibi yazıların da kağıttan bilgisayara aktarılmalarını sağlamalarıdır. Ancak, tarayıcı ile PC’ye aktarılan bir grafik dosyasına yazılan metinler, bilgisayar tarafından resim olarak görülür. Bir fotoğraftan farkı olmayan grafik dosyasının içindeki yazılar, 0CR (Optical Character Recognition; Optik karakter tanıma) adı verilen programlar vasıtasıyla çözümlenip metin dosyalarına çevrilir.
Böylece kağıt ortamındaki bir yazı, insan eliyle herhangi bir müdahaleye ve klavyeden tekrar veri girişine gerek kalmadan bilgisayara aktarılabilir. OCR programıyla ASCII metinlere dönüştürülen yazı üzerinde istenen şekilde işlemde yapılabilir. Üstelik, yazıların görüntü dosyası olarak değil de metin dosyası olarak saklanması çok daha az yer gerektirir.
Bilgisayarın kalıcı bellek kapasiteleri geliştikçe kağıt ortamındaki arşivler, tarayıcılar vasıtasıyla elektronik ortamlara aktarılıp saklanabilecek. Böylece istenen belgelere çok daha hızlı ulaşmak mümkün olabilecek, belgelerin zamanla bozulmasından dolayı oluşacak kayıplar kalkacak, bilgilerin işlenmesi kolaylaşacak, gerekli fiziksel saklama alanı azalacak...
Bunların hepsi iyi güzel de, bütün çabalara rağmen OCR yazılımlarının yüzde yüz hatasız çalışması mümkün değil hala!
OCR yazılımları genellikle karmaşık teknikler algoritmalar kullanır. Eski OCR teknolojisi, üst çizimde görülen matris yöntemine dayanırdı. Bu yöntem, taranan harfi bir matris içine yerleştirerek matrisin hangi hücrelerinin siyah olduğuna bakmaktan ibaretti. Elde edilen matris, harf kütüphanesindeki bir harf ile eşleştirilmeye çalışılıyordu. Fakat bu yöntemde farklı karakter tipleri (fontlar) büyük bir problem teşkil ediyordu; değişik fontlarla yazılmış yanı P harfi, matrisin değişik hücrelerinin siyah olmasına yol açıyor, bu da hatalara sebep oluyordu. Ortadaki çizim ise, “omnifont” adı verilen daha yeni bir teknolojiyi gösteriyor. Bütün fontları algılayabilen bu yöntem, harfleri bileşenlerine ayırıyor, bu bileşenleri içeren karakterleri yakalamaya çalışıyor. Örneğin P harfinin, dikey bir çizgi, bir daire ve bir yatay çizgiden oluştuğu varsayılarak bu karakteristikler taranan metinde yakalandığında P harfine çevriliyor.
Daha yeni bir teknoloji ise, “maksimum entropi” ilkesine göre işliyor: Taranmış metinde varolan lekelere yenilerini ekleyerek eski anlamsız lekelerden kurtulabiliyorsunuz!
Karakter tanıma, tek bir font söz konusu olduğunda çok daha kolay bir işlem. Oysa günümüz teknolojisi, bilgisayarın el yazısı dahil, pek çok değişik fontu da algılayabilmesini sağlamaya çalışıyor: PC’nizin, her bir fontun harflerini belleğinde tutup, “bu acaba Helveticanın a’sı mı, yoksa Times’in b’si mi?” diye tarama yapması hiç de kolay değil... Genelde, bizler, hangi fontla basılırsa basılsın, ne kadar güç okunur bir el yazısıyla yazılmış olursa olsun, harfleri tanırız ve karıştırmayız. Neden, çünkü tek bir harfin “a” mı yoksa “o” mu olduğunu anlayamasak da, cümlenin gelişi, dilimizin kelime haznesi yardımımıza koşar. “Bilgisayar” diye bir sözcük olmadığı için, a harfini 1 diye görsek bile sorun çıkmaz...
Bu durumdan hareketle, tek tek harflerden ziyade bütünden anlam çıkarmaya çalışan yöntemler geliştirildi. El yazısında da başarı sağlamaya çalışan bir yöntem harfleri topolojik özellikleri çözümleyerek belirliyor ve bu öğrendiklerine göre işlem yapıyor...
Karakter tanıma yazılımları, hata ortamını sıfıra indirmek için karmaşıklaştıkça daha fazla güç daha fazla hız gerektiriyorlar. Bu nedenle, yeni kuşak
PC’lerin, OCR uygulamalarında daha başarılı olacağı kesin.