MeÜ Öğretim Görevlisi Dr. Atçeken: Türkiye’de Veri Ekosistemi  Oluşturulması Gerekiyor

Veri konusu tüm dünyanın gündeminde olan ve her geçen gün önemi artan bir konu. Türkiye’de ise bu konuda ciddi çalışmalar çok az. Mersin Üniversitesinden bir grup akademisyen Türkiye’deki bu boşluğu görerek verinin sosyal bilimler alanında kullanılması konusunda pandemi döneminde bir çalışma başlattı. Bu çalışmayı daha sonra Mersin Üniversitesinde bir veri laboratuvarı oluşturmak amacıyla akademik bir çalışmaya dönüştürdüler. Vardıkları sonuç ise Türkiye’de bir veri ekosisteminin eksikliği oldu. Biz de bu çalışmanın içerisinde yer alan MeÜ İktisadi ve İdari Bilimler Fakültesi Öğretim Üyesi Dr. Kandemir Atçeken ile bu süreci ve Türkiye’de veri biliminin ne durumda olduğunu konuştuk.  

Veri bilimi üzerine çalışmalarınız nasıl başladı?

Pandemi öncesinde akademiden arkadaşlarla başlattığımız veri bilimi tartışması, pandemi sırasında kapanmaların etkisiyle daha da derinleşti. Temelde, sosyal bilimler alanında kullandığımız yöntem ve teknikleri geliştirmek amacıyla yola çıkmıştık. İlk aşamalarda bilgisayar tabanlı teknolojileri ve uygulamalı bilimleri anlamaya odaklandık. Bunun için Weka gibi uygulamalardan Python gibi programlama dillerine ve SQL gibi sorgu dillerine doğru ilerledik. Zaman içerisinde sosyal bilimlerde veri bilimi üzerine farkındalığı arttırmak için bu konuda bir merkez kuralım diye düşündük ve bu fikri geliştirmeye başladık.

Yalnız bizim derdimiz şu değildi; bilgisayar mühendislerinin oturup bizim için çalışma yapmasını istemedik. Biz, kentle ilgili sorunları verilere dayalı olarak bir sosyal bilimci gözüyle nasıl inceleyebiliriz konusunun peşindeydik. En azından ben bu tarafından bakıyordum. Diğer hocalar da, sosyal politika, ekonomi ve lojistik gibi kendi alanlarıyla ilişkilendirmeye çalışıyor. Bu yöntem ve teknikleri en çok kullanan uygulamalı bilimler ve özellikle bilgisayar mühendisliğiydi. Biz de onların alanına doğru kaymaya başladık.

Bu sizin için zor olmadı mı?

Evet, oldu. Disiplinler arası çalışmalarda uzlaşmak gerçekten zorlayıcı olabiliyor. Birisi olaya çok mekanik bir bakış açısıyla yaklaşırken, diğeri daha çok insan odaklı düşünme eğiliminde olabiliyor. Bu yüzden farklı perspektifler arasında anlaşmazlıklar doğabiliyor. Biz, çalıştığımız yazılımcı arkadaşlar ve hocalarla bu dil sorununu çözmekte hala zorlanıyoruz, ancak bir yol bulma çabası içindeyiz. Her yönden öğrenme ve gelişme çabamız devam ediyor.

Bu süreç nasıl devam etti?

Veri bilimi konusunda merkez kurmakla ilgilenirken ekip içerisinden Doç. Dr. Esra Dik’in Mersin Göç Araştırmaları Uygulama ve Araştırma Merkezi (MERGÖÇ) Müdürü olması bizim için bir dönüm noktasıydı. Bu durumu bir fırsat olarak değerlendirdik ve MERGÖÇ’ün veri ve göç konularında kendini ön plana çıkarabileceği bir alan olarak gördük. Bu birikim ve tecrübeyle ileride Mersin Üniversitesi’nde Sosyal Bilimler üzerine bir veri bilimi laboratuvarını daha güçlü şekilde kurabiliriz dedik. Bu kararın çok iyi bir tercih olduğunu düşünüyorum çünkü göç, kendine özgü dinamiklere sahip ve son derece popüler bir konu. Özellikle Suriyeliler konusunda, merkezi hükümet ve yerel yönetimler, çözüm arayışında ancak saha çalışmaları bu konuda yeterli olamıyor. Bu bağlamda, güçlü bir veri bilimi altyapısıyla daha etkili ve çözüm odaklı çalışmalara imkân oluşturulabilir.

Bu süreçte de biz verilere ulaşmaya çalışırken oturduğumuz yerden, “Bize veri getirin” demek yerine, sahaya inip yerel idare, yerel yönetimler ve odaları tek tek ziyaret ettik ve “Sizin için ne yapabiliriz?” diye sorduk. Biz, disiplinler arası bir ekip oluşturduk. Karmaşık teknikleri kullanabilen ve standart sosyal bilimler bakış açısının dışında kendini sürekli geliştiren hocalardan oluşuyoruz. Her türlü desteğe 7/24 açığız, dedik. Bu çabalarımızın ardından, Büyükşehir Belediyesi, MESKİ ve Göç İdaresi ile protokoller yaparak işbirlikleri kurduk.

Peki, verilere istediğiniz şekilde ulaşabildiniz mi?

Evet, bu süreç gerçekten işin en zor kısmıydı. Başlangıçta, neden akademisyenlerin kurumlardan veri alıp uluslararası düzeyde çalışma yapmadığını anlamakta zorlanıyorduk. Ancak gerçek şu ki, bir süre sonra veri edinme süreci oldukça karmaşık ve çözülmesi güç bir sorun haline geliyor. Mikro verilerle yapılan çalışmalar neredeyse yok denecek kadar az ve herkes sosyal bilimlerde veri biliminden, büyük veriden ve yapay zekâdan bahsediyor, ancak bu konuda pratikte yapılan çalışmalar oldukça sınırlı.

İşin içine girince fark ettik ki, veri edinme süreci gerçekten derin bir kuyu. Deneyenler bir süre sonra vazgeçmiş veya karşılaştıkları zorluklar nedeniyle geri adım atmış. Biz bu zorlukların üstesinden gelebilmek için çok uğraştık ve hala uğraşıyoruz. Bu noktada, Esra Hoca’nın bürokrasi ve yönetimle kurduğu doğru iletişim, verilere ulaşmamızda büyük katkı sağladı.

Ancak veriler gelmeye başladığında, ne kadar düzensiz ve karmaşık olduklarını fark ettik. Bu veriler, sadece kayıt altında tutmak amacıyla tutulmuş ve bir görev olarak algılanmış. Ancak bu görev, ne kadar değerli olduğunu anlatan bir rehberlikle desteklenmemiş. Bu da verilerin doğru, eksiksiz ve düzenli tutulmamasına neden olmuş. Buna ek olarak, veriyi tutan kişinin asıl görevinin veri tutmak olmadığını fark ettik. Bu görev onlara ekstra bir yük olarak verilmiş ve bu yüzden bazı kısımları eksik ya da hatalı bırakılmış. Bu durumda, kurum içinde ekstra veri analiziyle ilgilenen bir çalışan bulunmuyor, bu görev ekstra olarak atanıyor ve sürekli değişiyor.

Yine, veri talep ettiğimiz kurumlardan bazen 6 ay boyunca hiç veri gelmedi veya veri yanlış, hatalı veya eksik geldi. Bu verilerle uğraşmak gerçekten çok zaman aldı, ancak bir yandan da bu zorluklarla baş etmek, veriyle ilgili her aşamadan geçmek için bize birçok şey öğretti.

O zaman verilerin kaydedilmesi ve tutulması konusunda ciddi organizasyonel eksikliler de var mı? 

Evet, verilerin kaydedilmesi ve tutulması konusunda ciddi organizasyonel eksiklikler olduğunu söyleyebilirim. Ancak bu durum sadece Mersin’e özgü değil, bütün Türkiye’deki kurumları kapsayan genel bir organizasyon eksikliği. Ülkemiz dijitalleşme konusunda hızlı ve başarılı bir geçiş yaptı. Özellikle e-devlet uygulamaları bu konuda öncü bir başarı örneğidir. T.C. kimlik numarası da önemli bir adımdır ve Avrupa ülkelerinden önde olduğumuzu söyleyebilirim. Ancak, mikro verilerin nasıl kullanılacağı konusunda istenen ilerlemeye henüz ulaşılamamıştır. Bu durumdan şu sonuca varıyoruz: Ülkemizde veri konusunda bir ekosistem oluşmamıştır ve bu durumda ciddi bir planlama yapmak da mümkün değildir.

Böyle olunca da Sosyal Bilimler açısından durum pek de iyi olmasa gerek. 

Bu konuda Sosyal Bilimlerin kendi sınırları içinde kalmasının büyük eksiklik olduğunu söyleyebilirim. Mesela bizden bir bakanlık bir çalışma konusunda uzmanlık istedi. Bazen hocalar rapor hazırlarlar ve o raporun doğruluğunu kontrol etmesi için raporu başka bir hocaya sunarlar. Bu çalışmada, YÖK Veri Merkezindeki tezleri elle indirmişler ve veriyi oradan alarak kullanmışlar. Biz ise aynı tür çalışmalarda, Python’da kod yazarak ilgili tezleri indirip SQL içinde sorgulayarak daha fazla yayına daha kısa sürede ulaştık. Elle yapılması gereken işlemleri kod yazarak halletmek, gerçekten de işleri hızlandırıyor. Eğer bu işlemleri manuel olarak yapmaya kalkarsanız, bir sene boyunca uğraşabilirsiniz, ancak bir kod yazarsanız 1-2 günde veriyi alıp kullanabilirsiniz. Veri bilimiyle işler gerçekten bu kadar hızlanıyor.

Peki, bu kadar önemli bir işi yaygınlaştırmak için ne gerekiyor?

Her kurumun kendi verisine özgü bir veri yönetim sistemi kurması ve bu sistemleri standartlaştırması gerekiyor. Eğer bir kentte bunu başarabilirsen, başarılı bir model oluşturmuş oluyorsun. Ardından bu modeli diğer yerlere de uygulayabilirsin. Ancak, bu konuyu öncelik olarak belirlemezsek, gerçekten büyük bir fırsatı kaçırıyoruz. Bu adım atılmadığında, çok önemli bir ilerleme fırsatını kaçırıyoruz demektir.

Böyle bir veri sistemi ile neler yapılabilir?

Örneğin, MESKİ verisi üzerinden su tüketimi analizi yaparak kentteki durumu anlamaya çalışıyoruz. Bunu MESKİ de yapıyor. Bunu depremde yaptı. Depremde şehrin nüfusu için yüzde 15 arttı dedi. Ama bu çok makro bir veri. Aslında, MESKİ verisinden çok daha anlamlı ilişkiler çıkarabiliriz. Sadece kentin nüfusunun yüzde 15 artması değil, ne kadar su kullanıldığını, hangi mahallelerde veya sokaklarda anomalilerin olduğunu bilmemiz gerekiyor. Bu detaylı bilgiler, kentin nereye gittiğini, yoğunlukların nerede olduğunu daha iyi anlamamıza yardımcı olur. Bu tür ayrıntıları bilmeden, o yüzde 15 verisini tam anlamıyla değerlendirmek zor. Dolayısıyla, kendi verilerimizden kentin geleceğine dair daha detaylı projeksiyonlar oluşturmamız gerekiyor.

Bu teknolojinin yanlış kullanılabileceği ve veri toplamaya dayalı akıllı kentler ile ilgili de endişeler var.  

Teknolojinin yanlış kullanılabileceği ve veri toplamaya dayalı akıllı kentlerle ilgili endişelerin olması doğal bir durum. Ancak, teknolojiye karşı çıkarak ya da kötüleyerek bir yere varamayız. Eğer baş aşağı duran şeyler var ise, ayakları üzerine oturtmak mümkün. Akıllı kentler tartışması gerçekten panoptikon gibi gözetim toplumuna da dönüşebilir ama paydaşlar bunun farkında olurlarsa, veri tartışmasını iyi değerlendirirlerse şunu söyleyebilirler; bu yaptığınız şeyler bir şekilde bizi gözetlemeye mi gidiyor? Verileri bu amaçla mı tutuyorsunuz? Kent bu tartışmayı yapar. Şu an kent veriyle ilgili hiçbir şey bilmiyorsa ne tartışması yapacak? Bence o tartışmalara daha bizim vaktimiz var. Oraya gitmek gerekiyor ama oraya gidene kadar bizim öncelikle bir farkındalık oluşturmamız ve bu anlamda bir yol almamız gerekiyor.

Verinin dijital bir şekilde tutulması kaynakların israfını da önlemiyor mu?

İlk başta dijitalleşme, bizi kâğıt israfından kurtardı ve zaman tasarrufu sağladı. Veri artık klasörlerde, poşetlerde veya torbalarda değil, dijital ortamlarda tutuluyor. Şimdi, bu dijitalleşmeyi bir adım öteye taşıma zamanı geldiğini düşünüyoruz. Artık sadece zamandan ve kâğıt israfından tasarruf etmiyoruz, aynı zamanda yapay zekâ kullanarak sürekli olarak tüm kaynakların kullanımı için tahmin edilebilir projeksiyonlar üretecek bir aşama içerisindeyiz.

Böyle bir sistem kamu politikalarının oluşturmasında ve kamu kaynaklarının kullanılmasında da çok büyük bir tasarruf sağlamaz mı?

Hem kaynakları etkili bir şekilde kullanma hem de şeffaflığı artırma açısından birçok avantajı var. Bu avantajları daha görünür hale getirmemiz gerekiyor. Biz de Mersin’den başlayarak bu çabayı sürdürmeye çalışıyoruz.

Peki veri konusunda bir sonraki adımınız ne olacak?

Bu yıl içinde Mersin’de uluslararası bir çalıştay düzenlemeyi planlıyoruz. Yurt dışındaki iyi uygulamaları yapan akademisyenleri davet edip burada bir çalışma yapacağız. Bu çalıştayı düzenledikten sonra, temel düzeyde farkındalığı artırmak amacıyla veri ve verinin tutulması konusunda bir eğitim programı hazırlayacağız. Eğer bunu Mersin Büyükşehir Belediyesi ile başarabilirsek, ilerleyen zamanlarda bu model başka belediyelere de örnek olabilir. Böylece veri bilimi konusunda tüm Türkiye’de farkındalığı arttırmayı planlıyoruz.

Yorumlar kapalı, ancak trackbacks Ve pingback'ler açık.