Ana sayfa Genel Nasıl Veri Toplanır?

Nasıl Veri Toplanır?

13954
8
PAYLAŞ

Merhaba Okurlar,

Bu gün sizlere Veri Bilimcilerinin en zorlandığı kısım olan veri toplama kısmından bahsedeceğim.

Veri Toplama Neden Önemlidir?

Veri toplamanın önemi bir veri bilimcisi için tarif edilemez sebebi ise verisiz iş yapamaz, problem çözemez, model geliştiremez ve yeni yeni veri bilimine adım atmış veri bilimciler veri toplama kısmında gerçekten sorun yaşarlar.

Peki ya bu sorunu nasıl çözebiliriz?

Veri Toplama için Kişisel Önerilerim

Ben sektöre yeni girmeye çalışan bir veri bilimcisi olarak neredeyse hiç veri bulma sorunu yaşamadım sebebi ise problemlerimin çoğu kendi verimi kendim toplamamı gerektirecek şekildeydi.

Kendi Verini Kendin Toplamak?

Öncelikle önünüze problem geliyor veya bu problemi siz kurguluyorsunuz ardından ben daha çok google forms kullanıyorum, google forms’tan probleminizi çözmek için gereken verileri verecek soruları ayarlıyorsunuz, Örnek vermek gerekise ; Tıkla1 Tıkla2 Ardından bu aldığınız verileri csv şeklinde indiriyorsunuz ki google size her türde indirme imkanı sağlıyor. ardından bu dataları alıp çalışmalarınızda kullanabilirsiniz. Bu seçim biraz zorlayaacaktır sizi sebebi ise bu anketleri dolduracak adamları bulmak, bunlar için ben facebook gruplarını kullanıyorum aktif olarak sizede araştırmanın içeriğine konusuna göre facebook grubu taraması yapıp onlar üzerinden gitmenizi öneririm.

Elden toplama yöntemi ise soruları kağıda basıp sahillere okullara gidip 1-1 toplamak ardından bunları excele döküp kullanmak 21. Yüzyılda bile elden toplama en rahat ve güvenilir kaynak bence.

Veri Bilimcilerinin Birbirini Kollaması ?

Kaggle diye adlandırdığımız bu sitede veri bilimcileri veri bazında birbirlerini kolluyor çalışmalarını ve çalışmalarının verilerini paylaşıyorlar, burada bayağı büyük bir veri istediğiniz konuyu yazıp istediğiniz veriyi indirmeden onların kernel diye adlandırdığı hücreli kod + yazı yazabildiğiniz yapıda araştırmalar yaparak sorunlara çözümler bulabiliyorsunuz aynı zamanda bu kaggle da bazen yarışmalar da oluyor bu yarışmalardan bayağı güzel ödüller kazanıp birde iş veya staj teklifi olarak size dönüşünü sağlayabiliyorsunuz. Kaggle kullanmak veri bilimci için gerçekten büyük bir kolaylık ben daha önce buraya birkaç veri seti ve çalışmalarımın hepsini yükledim. Çalışmaları buradan yapmak çok daha rahat oluyor sebebi ise görsellik + kolay ulaşılabilirlik + her yerden erişim + paket indirmemek.

Benim çalışmalarıma ulaşmak için Tıklayın

Eğer Kaggle’da dataseti düzgün şekilde açıklar ve güzel bir dataset yüklerseniz datasetiniz seçilmiş datasetler kısmına giriyor daha sonra bunlar sitenin anasayfasında yayımlanıyor. İnsanlar verisetinizi kullanıp başka problemleride çözebiliyor. böylece verisetinizle başka nasıl problemler çözülebilir diye görebiliyorsunuz.

Verinin Erişilebilirliği

Verinin erişilebilirliği konusunda artık yavaş yavaş insanlar verilerini paylaşıyor. Önemli olan bu verilere erişmek, Geçtiğimiz haftalarda Uzay Çetin’in Düzenlediği Karmaşık Sistemler ve Veri Bilimi Çalıştayında veri.org diye bir site kurulması gerektiğini ve insanların verilerini burada paylaşması gerektiğini tartışmışlardı. Benimde aklıma aslında “Kaggle var ya? neden veri.org oluşturulsun ki” sorusu takıldı. Sonradan insanların kaggle’ın ne olduğunu bilmediğini farkettim. Veriye erişmek basit ama doğru yolu bulmak gerek bence.

Siz siz olun verinizi saklamayın yaşasın AÇIK KAYNAK KOD yaşasın AÇIK VERİ !!!!

8 YORUMLAR

  1. Have you ever considered about including a little
    bit more than just your articles? I mean, what you say is important and all.
    But think about if you added some great graphics or video clips
    to give your posts more, “pop”! Your content is excellent but with
    pics and video clips, this website could undeniably
    be one of the very best in its niche. Good blog!

BİR CEVAP BIRAK

Please enter your comment!
Please enter your name here