Aramaya Dön

Büyük ölçekli sistem günlüklerinden anormallik tespiti için dağıtılmış makine öğrenimi algoritmalarının değerlendirilmesi: bir vaka çalışması

İsim	Büyük ölçekli sistem günlüklerinden anormallik tespiti için dağıtılmış makine öğrenimi algoritmalarının değerlendirilmesi: bir vaka çalışması
Yazar	Astekin, M., Zengin, H., Sözer, Hasan
Basım Tarihi:	2018
Basım Yeri	- IEEE
Konu	Log analizi, Dağıtık sistemler, Paralel işleme, Anormallik tespiti, Büyük veri, Makine öğrenimi
Tür	Belge
Dil	İngilizce
Dijital	Evet
Yazma	Hayır
Kütüphane:	Özyeğin Üniversitesi
Demirbaş Numarası	978-153865035-6
Kayıt Numarası	9d1d1493-2379-40d2-9e1b-8af75e88c82e
Lokasyon	Bilgisayar Bilimi
Tarih	2018
Notlar	TÜBİTAK-BİLGEM Bulut Bilişim ve Büyük Veri Laboratuvarı (B3LAB); Özyeğin Üniversitesi Yazılım Araştırma Laboratuvarı (SRL)
Örnek Metin	Anormallik tespiti, büyük ölçekli, dağıtılmış sistemlerdeki hataları tespit etmek ve teşhis etmek için değerli bir özelliktir. Bu sistemler genellikle bu amaç için kullanılabilecek on milyonlarca satırlık günlük sağlar. Ancak geleneksel makine öğrenimi algoritmalarının merkezi uygulamaları bu verileri ölçeklenebilir bir şekilde analiz etmekte yetersiz kalıyor. Bu zorluğun üstesinden gelmenin bir yolu, diğer dağıtılmış sistemler tarafından oluşturulan çok büyük miktardaki günlükleri analiz etmek için dağıtılmış sistemleri kullanmaktır. Bu amaçla iki denetimsiz makine öğrenimi algoritmasını bir kıyaslama veri kümesinde değerlendirmek için bir örnek olay çalışması gerçekleştirdik. Özellikle PCA ve K-means algoritmalarının dağıtılmış uygulamalarını değerlendirdik. Bu algoritmaların doğruluğunu ve performansını hem birbirlerine hem de merkezi uygulamalarına göre karşılaştırdık. Sonuçlar, dağıtılmış sürümlerin, merkezi sürümleriyle karşılaştırıldığında aynı doğruluğu elde edebildiğini ve büyük siparişlerde performans artışı sağlayabildiğini gösterdi. Paralellik derecesi arttıkça ikisi arasındaki farkın azalma eğiliminde olduğunu gözlemlesek de PCA'nın performansının K-ortalamalarından daha iyi olduğu ortaya çıktı.
DOI	10.1109/BigData.2018.8621967

Kaynağa git Özyeğin Üniversitesi Özyeğin Üniversitesi - Osmanlıca el yazması arama motoru

Özyeğin Üniversitesi

Büyük ölçekli sistem günlüklerinden anormallik tespiti için dağıtılmış makine öğrenimi algoritmalarının değerlendirilmesi: bir vaka çalışması

Yazar Astekin, M., Zengin, H., Sözer, Hasan

Basım Tarihi 2018

Basım Yeri - IEEE

Konu Log analizi, Dağıtık sistemler, Paralel işleme, Anormallik tespiti, Büyük veri, Makine öğrenimi

Tür Belge

Dil İngilizce

Dijital Evet

Yazma Hayır

Kütüphane Özyeğin Üniversitesi

Demirbaş Numarası 978-153865035-6

Kayıt Numarası 9d1d1493-2379-40d2-9e1b-8af75e88c82e

Lokasyon Bilgisayar Bilimi

Tarih 2018

Notlar TÜBİTAK-BİLGEM Bulut Bilişim ve Büyük Veri Laboratuvarı (B3LAB); Özyeğin Üniversitesi Yazılım Araştırma Laboratuvarı (SRL)

Örnek Metin Anormallik tespiti, büyük ölçekli, dağıtılmış sistemlerdeki hataları tespit etmek ve teşhis etmek için değerli bir özelliktir. Bu sistemler genellikle bu amaç için kullanılabilecek on milyonlarca satırlık günlük sağlar. Ancak geleneksel makine öğrenimi algoritmalarının merkezi uygulamaları bu verileri ölçeklenebilir bir şekilde analiz etmekte yetersiz kalıyor. Bu zorluğun üstesinden gelmenin bir yolu, diğer dağıtılmış sistemler tarafından oluşturulan çok büyük miktardaki günlükleri analiz etmek için dağıtılmış sistemleri kullanmaktır. Bu amaçla iki denetimsiz makine öğrenimi algoritmasını bir kıyaslama veri kümesinde değerlendirmek için bir örnek olay çalışması gerçekleştirdik. Özellikle PCA ve K-means algoritmalarının dağıtılmış uygulamalarını değerlendirdik. Bu algoritmaların doğruluğunu ve performansını hem birbirlerine hem de merkezi uygulamalarına göre karşılaştırdık. Sonuçlar, dağıtılmış sürümlerin, merkezi sürümleriyle karşılaştırıldığında aynı doğruluğu elde edebildiğini ve büyük siparişlerde performans artışı sağlayabildiğini gösterdi. Paralellik derecesi arttıkça ikisi arasındaki farkın azalma eğiliminde olduğunu gözlemlesek de PCA'nın performansının K-ortalamalarından daha iyi olduğu ortaya çıktı.

DOI 10.1109/BigData.2018.8621967