Regular Expression
Merhabalar,
Bugün yeni gelen bilgisayar masamın şerefine bir yazı yazmak istiyordum ama öyle boşu boşuna yazı yazamayacağım için arada sizlere regular expression’dan bahsetmek istiyorum :)
Öncelikle sizlerin de yazılım hayatınıza başlayalı 5~10 yılı geçtiyse artık etraf koddan geçilmez hale gelir. Her yerde başka kodlar, hepsinize siz yazmışsınızdır ama.. “kardeşim ne yazmışım yaa, bu kadar da olmaz ki”.. dersiniz. Daha sonrasında kendinizi birşeyler araken ve en önemlisi bulumazken bulacaksınız.. “ahh nereye koymuştum bunu salak şeyi..” dersiniz.. tekrar dersiniz.. ama bunu söylemenin bir etkisi yoktur, gene bulamazsınız.. gene bulamazsınız.
Ya da size bir iş verirler. RegEx (Regular Expression) kullanmanız gerekir.. Gerekir gerekir gerekmez demeyin. Örnek vermek gerekir ise, geçen gün Zodazone Türkiye’de belirli bir tabloda yer alan açıklama bilgilerini değiştirilmesi istendi üstlerden biryerlerden (ne biliyim muhasebeden falan işte..).
Bize bir ofis dökümanı içerisinde tekil kod bilgisini ve yanında yeni açıklamasını gönderdiler.. Onlar oturmuş kasmış… hatta uğraşmış basahlara kadar 150 civarındaki açıklayı kafa patlatmışlar, düşünmüşler, taşınmışlar.. ve değiştirmişler.. Tabii ne zennetiniz sadece bunun için maaş alan adamlar bile mevcut.
Ehh tabii bu Tankut kardeşiniz oturup, 150 tane açıklama alanını tek tek yapacak hali yok. Deli miyim ben :) söz meclisten dışarı efenim :) Neyse şimdi bu dökümanı gönderdiler ya içerisinde sadece açıklama bilgisi bulunmuyor ki, kim bilir hangi düzenle yazdılar bu dökümanı diye bir düşünün bakalım.. Regular Expression olmadan adım atamazsın adım….
Neyse öncelikle güzel güzel açıklayalım bu RegEx nedir, ne değildir ?
RegEx, karakter yığınları içerisinde özel belirtilen karakter veya karakter kümelerini bulmak, diğerlerinden ayırmak için kullanılan oldukça gelişmiş bir kütüphanedir. Kullanımı biraz zordur, hemen kısa sürede alışmanız zor olabilir.
Öncelikle RegEx tanımlarını ve anahtar kelimelerini tanıyalım; (Kitap yazmıyoruz burada ona göre.. tüm özelliklerini yazmıyorum sadece çok kullandıklarımı)
Anahtar kelimeler:
^ : Satır başını ifade eder.
\n : Enter karakteri için kullanılır.
\t : Tab karakteri için kullanılır
[…] : Örnek: [aeıioöuü] sadece sesli harfleri bulunur. ‘[]’ karakterleri içerisinde yer alan herhangi bir karaktere uyanları getirir.
[^…] : Örnek: [^aeıioöuü] sadece sessiz harfleri bulunur. ‘[^]’ karakterleri içerisinde yer alan herhangi bir karaktere uymayanları getirir.
. : Yeni satır (\n) karakteri hariç herhangi bir karakteri ifade eder. Tek karakteri
\w : Herhangi bir alfanumeric veya numeric karakteri işaret eder. a..z, A..Z, 0..9
\W : \w’nin tersidir.
\d : \d herhangi numeric karakter.
\D : \d’nin tersi.
\ : bir sonraki karakter özel bir anlam ifade ediyorsa, bu özelliği iptal eder.
Destekleyiciler
? : Bir önceki karakterden bir tane var ise bulur.
+ : Bir önceki karakterden bir ve birden fazla var ise.
* : Bir önceki karakterden 0 ve birden fazla var ise.
{n} : Bir önceki karakterden n adet olanları bulur.
(…) : Gruplama işlemi yapar. ‘()’ içerisine yazılanlar grup olarak değerlendirilir.
| : ‘OR’ işlemi için kullanılır, 2 farklı RegEx bu şekilde bağlanabilir.
Opsiyonlar:
i : Büyük küçük harfe duyarlı olmaz.
m : Karakter katarını birden çok satırmış gibi düşünür.
s : Karakter katarını tek satırmış gibi düşünür.
Kolay gelsin.. :)

24.09.2007-23:22'de dedi şöyle dedi;
uvvv ne güzel yazı olmuş bu :)
11000 bounce etmiş mailin ufak bir hata sonucu mail box’ıma download’undan sonra…
hepsini tek tek kontrol edip mail adreslerini excel sheet’e yazamayacağıma göre :) aklıma hemen regEx geldi.
Ufak bi araştırmadan sonra http://www.regular-expressions.info/ sitesinde keşfettiğim “powergrep” gibi bir program sayesinde yaklaşık 20 dk. içinde tüm mail adreslerini tek bir txt dosyasına kopyalamıştım.
Önünde saygı ile eğiliyoruz RegEx :)
dip not: Yazılım hayatım 5-10 yıl önce başlamadı ama başlamış olan güzel abilierime teşekkürü bir borç bilirim :)
25.09.2007-20:58'de dedi şöyle dedi;
İyiki yazdık “kısa sürede alışmanız zor olabilir” diye, sen otur 20 dakkida çöz. Ben öyle yazdım ya inadına yaptın değil mi :)
27.09.2007-2:05'de dedi şöyle dedi;
Ben “PowerGREP” sayesinde demiştim ama :) ( editplusta yazamadım yeminle RegEx. )
Alışılması gerçekten zor :) hele hele Tankut’ın dediği gibi “kısa sürede alışmak çokkkk zor” :)
01.10.2007-1:15'de dedi şöyle dedi;
Ruby kullananlar Ruby’nin RegEx’e doğal desteği olduğunu bilirler muhtemelen. Belki yazının sonunda bir ufak örnek olsaydı güzel olurdu diye düşünüp hemen bir örnek yapmaya karar verdim.
string1 = “I will drill for a well in walla walla washington.”
if string1 =~ /(w.ll)/
print “Matched on “, $1, “\n”
else
puts “NO MATCH”
end
=~ operator’u regular expression kullanarak kontrol yapar. Bulduğu ilk değeri $1 değişkenine atar. İkinci bulduğu değeri $2, $3 diyerek erişebiliriz.
02.10.2007-14:05'de dedi şöyle dedi;
Son söz,
Regular Expressions hayat kurtarır, öğrenin.
Dalgıçlıkta kullanılan bir söz vardır, biraz bu söze benzer;
“Bıçağınızı yanınızdan ayırmayın, genellikle ihtiyacınız olmaz. Olduğunda yanınızda bıçak yoksa bir daha hiç ihtiyacınız olmaz.”
Kolay gelsin.