Veri Madenciliği-Data Mining Nedir?

veri madenciliği 1990'larda ortaya çıkmış bir araştırma alanıdır ve günümüzde çok popülerdir.

Veri madenciliği 1990’larda ortaya çıkmış bir araştırma alanıdır ve günümüzde çok popülerdir. Veri madenciliğinin popüler olmasının nedenleri, elektronik ortamda veri depolamanın çok ucuza gelmesi ve bugün sahip olduğumuz hızlı bilgisayar ağları sayesinde veri transferinin çok hızlı bir şekilde yapılabilmesidir. Sonuç olarak artık birçok organizasyonun veritabanlarında depolanan ve analiz edilmesi gereken çok büyük miktarda veri var. Veritabanlarında çok fazla veri olması harika. Ancak, bu verilerden gerçekten faydalanmak için, onu anlamak için verileri analiz etmek gerekir. Anlayamadığımız veya ondan anlamlı sonuçlar çıkaramadığımız verilere sahip olmak işe yaramaz. Verileri analiz etmek ve ilginç örüntüler , eğilimler veya diğer faydalı bilgileri çıkarmak için otomatik teknikler tasarlanmıştır. Genel olarak, veri madenciliği teknikleri ya geçmişi açıklamak-anlamak ya da geleceği tahmin etmek için tasarlanmıştır.

Veri Madenciliği Tanımı

Data Mining, basit analizlerin ötesine geçen kalıpları ve eğilimleri keşfetmek için büyük veri depolarını otomatik olarak arama pratiğidir. Veri madenciliği, verileri bölümlere ayırmak ve gelecekteki olayların olasılığını değerlendirmek için karmaşık matematiksel algoritmalar kullanır.

Veri madenciliği, disiplinlerarası bir araştırma alanıdır. Veri Görselliği, Veri Tabanı Sistemleri, Yapay Sinir Ağları, İstatistik, Yapay Öğrenme, vb. uygulama alanlarını içermektedir.

Veri Analizi Süreçleri Nedir?

Veri madenciliği gerçekleştirmek için genellikle yedi adımdan oluşan bir işlem takip edilir. Bu sürece genellikle “ Veri Tabanındaki Bilgi Keşfi ” süreci denir .

  1. Veri temizleme : Bu adım, verilerin analizinde sorun olabilecek gürültü veya diğer tutarsızlıkları gidererek verileri temizlemekten oluşur.
  2. Veri entegrasyonu : Bu adım, analiz edilmesi gereken verileri hazırlamak için çeşitli kaynaklardan gelen verileri entegre etmekten oluşur. Örneğin, veriler birden fazla veritabanında veya dosyada depolanıyorsa, verileri analiz etmek için tek bir dosya veya veritabanına entegre etmek gerekebilir.
  3. Veri seçimi : Bu adım, yapılacak analiz için ilgili verilerin seçilmesinden ibarettir.
  4. Veri dönüşümü : Bu adım, veri madenciliği teknikleri kullanılarak analiz edilebilecek verileri uygun bir formata dönüştürmekten oluşur.
  5. Veri madenciliği : Bu adım, verileri analiz etmek ve ilginç örüntüleri keşfetmek veya bu verilerden ilginç bilgiler elde etmek için bazı veri madenciliği teknikleri (algoritmalar) uygulamasından oluşur.
  6. Keşfedilen bilginin değerlendirilmesi: Bu adım verilerden elde edilen bilginin değerlendirilmesinden oluşur. Bu, nesnel ve / veya sübjektif önlemlerle yapılabilir.
  7. Görselleştirme : Son olarak, son adım verilerden elde edilen bilgiyi görselleştirmektir.

Veri Madenciliği Uygulamaları

Verilerin analiz edilmesi her tür alana uygulanabilen çok çeşitli veri madenciliği teknikleri (algoritmaları) vardır. Bazı veri madenciliği uygulamaları örneği;

  • sahtekarlık tespiti,
  • borsa fiyatı tahmini,
  • Müşterilerin davranışlarını ne satın aldıklarına göre analiz edebilme

Çoğu işletme ve kuruluş, operasyonları hakkında veri toplar. Daha sonra bu verileri faaliyetlerine ilişkin içgörü elde etmek için incelemektedir.

Genel olarak veri madenciliği teknikleri aşağıdakilere göre seçilir:

  • analiz edilecek verilerin türü
  • Verilerden çıkarılacak bilgi veya kalıp türü
  • bilginin nasıl kullanılacağı

E-ticarette Veri Madenciliği

İnternetin doğası gereği e-ticaret işletmeleri, müşterileri veya olası müşterileri hakkında çok fazla bilgi edinmektedirler. Bir satın alma işlemi yapıldığında, bir hesap oluşturulduğunda veya bir sayfa görünümü yapıldığında veriler elde edilir. Bu ham veriler, tüm hesap ve ödeme bilgilerini içeren bir e-ticaret web sitesiyle ilişkili veritabanından ve Google Analytics gibi web analitik araçlarından gelebilir.

1.) Pazar Bölümlendirme:
Örneğin, bir giyim web sitesinin Google Analytics’i, 100 ziyaretçiden 82’sinin kadın, 100’den 92’sinin İngiltere’de yaşadığını ve 100’den 70’in 18-34 yaş arasında olduğunu ve % 10’unun sporla ilgilendiği analizini vermektedir. Veri madenciliği tekniklerini kullanarak, siteyi ziyaret eden kişi tipi için profil oluşturmaya başlamak mümkündür. Bu, işletmenin bu kişilere göre ürünler pazarlamasını ve oluşturmasını sağlar. Veri toplama ve veri madenciliği teknikleriyle analizinin bu birleşimi, işletme sahiplerine, izleyicilere dayanarak, kadın spor kıyafetlerini pazarlamaya ve satmaya başlamasının faydalı olacağını söylemektedir.

2.) Sepet Analizi:
Veri madenciliği ile Amazon diğer promosyonlu öğeleri bannerlar ile yükselterek satışı arttırmıştır. Örnek olarak, ‘bu ürünleri de satın alan müşteriler’, ‘sizin için önerilen’ ve ‘sık sık birlikte satın alınan’ gibi paketleri kullanmıştır. Bu çapraz satışın sepetin ortalama sipariş boyutunu arttırdığı kanıtlanmıştır. Veriler, kullanıcının sitede gezinme sürecinin her aşamasında alınır. Kullanıcının yalnızca bir ürünü taradığı veya sepetine eklediği, ancak satın almadan gittiği veya satın alma yolunu takip ettiği, ancak teslimat fiyatını gördüğü zaman siparişi iptal eden veriler depolanır. Bu veriler, şirkete ücretsiz teslimat teklif etmeleri gerektiğini, belki de satın almalarını geri almalarını ve bitirmelerini istemek için özel bir teklifle birkaç gün içinde bu müşteriye bir e-posta göndermeleri gerektiğini bildirmek için işlenebilir.

3.) Satış Tahmini:

Veri madenciliği ile şirketler satış tahmini, stok kontrolü, fiyatlandırma ve pazarlama için yararlı olan şeyleri tahmin etmek için verileri kullanır. Haftalık alışverişinizi çevrimiçi yaparsanız, süpermarket satın alma alışkanlıklarınızı ve ayrıca tüketim alışkanlıklarınızı öğrenir. Ocak ayının ilk haftasında 100 çay poşeti ve ardından Şubat ayının ilk haftasında tekrar satın alırsanız, süpermarket sizi 100 çay poşeti kullanmanın yaklaşık bir ay sürdüğünü öğrenir. Oradan, Şubat ayının sonuna doğru, çay poşetleri tekliflerini hedefleyebilirler çünkü neredeyse tükendiğini biliyorlar. Yılın çeşitli zamanlarında depoda ne kadar stok bulundurmaları gerektiğini de bu şekilde tahmin edebilirler.

Veri Madenciliğinin Geleceği

Veri madenciliği ve veri bilimi için gelecek parlaktır çünkü veri miktarı gün geçtikçe artmaktadır. 2020 yılına kadar, birikmiş dijital veri evrenimiz 4.4 zettabayttan 44 zettabayta büyüyecek. Gezegendeki her insan her saniye 1.7 megabayt yeni bilgi yaratacak.

Bir zamanlar, yalnızca NASA gibi kuruluşlar süper bilgisayarlarını verileri analiz etmek için kullanabilirlerdi; veri saklama ve bilgi işlem maliyeti çok büyüktü. Artık şirketler makine öğrenimi , yapay zeka ve bulut tabanlı veri gölleriyle derin öğrenim ile her türlü ilginç şeyi yapıyorlar .  

Nesnelerin interneti ve giyilebilir teknoloji insanları ve cihazları veri üreten makinelere dönüştürdü. Eğer şirketler ya da kuruluşlar verileri yeterince hızlı toplayabilir, depolayabilir ve analiz edebilirse insanlar hakkında sınırsız içgörüler elde edebilir.

2020 yılına kadar Nesnelerin İnterneti’nde (IoT) yaklaşık 20 milyar bağlı cihaz olacak. Oluşturulan veriler bulutta mevcut olacak ve bu durumdan gelen bilgi kütlelerinin üstesinden gelebilecek esnek, ölçeklenebilir analitik araçlara acil bir ihtiyaç yaratacaktır.

İstanbul Üniversitesi-İletişim Fakültesi / Halkla İlişkiler ve Tanıtım Mezunu /Dijitalyolcu.com'un Kurucusu Dijital Pazarlama & Sosyal Medya & İçerik Editörlüğü konularında deneyimli. En büyük ilk zevki okumak ikincisi ise yazmak. Dijital Pazarlama alanında kendini geliştiriyor ayrıca bilgi ve deneyimlerini paylaşmaktan mutlu oluyor.
Yazı oluşturuldu 58

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer yazılar

Aramak istediğinizi üstte yazmaya başlayın ve aramak için enter tuşuna basın. İptal için ESC tuşuna basın.

Üste dön
%d blogcu bunu beğendi: