MEDICAL DATASET CLASSIFICATION BASED ON DIFFERENT DEEP LEARNING TECHNIQUES AND META-HEURISTIC ALGORITHMS
Date
2023-01-30
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Medicine is one of the fields where computer science advancement is making
significant progress. The usage of Computers in Medical improves precision and
accelerates data processing and diagnosis. There are currently a variety of computer assisted diagnostic systems, with deep-learning algorithms playing an important role.
Systems that are more precise and faster are required. Computer-aided diagnosis
(CAD) has proved to be an effective and accurate method for diagnostic prediction
over the years. This study focuses on the development of an automated CAD system
with the intent to perform diagnosis as accurately as possible. Deep learning methods
have been able to produce impressive results on medical image datasets. In this thesis,
several combinations of different deep learning techniques with the meta-heuristic
algorithm, each of the deep learning methods either the convolutional neural network
or the auto-encoder were applied to extract the effective features from two different
medical datasets COVID-19, and the brain tumor with the aid of the meta-heuristic
method to select the optimal features in order to cover a several medical datasets
detections. The first combination of several pre-trained convolutional neural networks
(CNN) AlexNet, GoogleNet, ResNet 50, and DenseNet 201 was used with three types
of Meta-Heuristic Algorithms Ant Colony Optimization algorithm (ACO), Particle
Swarm Optimization algorithm (PSO), and Genetic Algorithm (GA). The second
combination was Auto-encoder with three types Meta-Heuristic Algorithms ACO,
PSO, and GA which was an innovative method, that seeks to reduce the size of the
dataset while maintaining the original performance of the data.
The employing of deep learning methods in conjunction with meta-heuristic
algorithms and supervised machine-learning algorithms to perform an accurate
diagnosis. Pre-trained convolutional neural networks (CNNs) or auto-encoder are used
for feature extraction, whereas feature selection is performed using ACO or PSO, or
GA. Ant colony optimization helps to search for the best optimal features while
reducing the amount of data. Lastly, diagnosis prediction (classification) is achieved
using learnable classifiers. The novel framework for the extraction and selection of
features is based on deep learning, auto-encoder, and ACO. The performance of the
proposed combination is evaluated with classifiers like decision tree (DT), support
vector machine (SVM), k-nearest neighbors (KNN), ensemble, Naive Bayes, and
discriminant using two medical image datasets: chest X-ray (CXR) and magnetic
resonance imaging (MRI) for the prediction of the existence of COVID-19 and brain
tumors. Accuracy is used as the main measure to compare the performance of the
proposed approach with existing state-of-the-art methods. The proposed system
achieves an average accuracy of 99.61% and 99.18%, outperforming all other methods
in diagnosing the presence of COVID-19 and brain tumors, respectively. Based on the
achieved results, it can be claimed that physicians or radiologists can confidently
utilize the proposed approach for diagnosing COVID-19 patients and patients with
specific brain tumors. Also, in this thesis, a combination of different deep learning
techniques with the meta-heuristic algorithm, each of the deep learning methods either
the convolutional neural network or the auto-encoder were applied to extract the
effective features from two different medical datasets, with the aid of the meta heuristic method to select the optimal features obtained by the particle swarm
optimization algorithm (PSO) this combination is considered as an innovative method,
seeks to reduce the size of the dataset while maintaining the original performance of
the data. The covid-19 dataset found that the highest accuracy by the combination of
CNN-PSO-SVM was 99.76%, and for the common brain tumor dataset, the accuracy
of 99.51% as the highest was obtained by the combination method autoencoder-PSO KNN. We notice that the combination model of the deep learning method with the
PSO feature selection algorithm takes a consuming time much longer than the same
method with the ACO algorithm at the same time the accuracy of PSO is near to ACO
accuracy.
Description
FARKLI DERIN ÖĞRENME TEKNIKLERI VE META-SEZGISEL
ALGORITMALARA DAYALI TIBBI VERI KÜMESI SINIFLANDIRMASI
ÖZ: Tıp, bilgisayar bilimindeki ilerlemenin önemli ilerleme kaydettiği alanlardan biridir. Bilgisayarların Tıpta kullanımı kesinliği artırır ve veri işlemeyi ve teşhisi hızlandırır. Şu anda, derin öğrenme algoritmalarının önemli bir rol oynadığı çeşitli bilgisayar destekli teşhis sistemleri bulunmaktadır. Daha hassas ve daha hızlı sistemlere ihtiyaç vardır. Bilgisayar destekli teşhis (CAD), yıllar içinde teşhis tahmini için etkili ve doğru bir yöntem olduğunu kanıtlamıştır. Bu çalışma, teşhisi olabildiğince doğru bir şekilde gerçekleştirmek amacıyla otomatik bir CAD sisteminin geliştirilmesine odaklanmaktadır. Derin öğrenme yöntemleri, tıbbi görüntü veri kümeleri üzerinde etkileyici sonuçlar üretebilmiştir. Bu tezde, iki farklı tıbbi veri kümesinden COVID 19, ve birkaç tıbbi veri seti tespitini kapsayacak şekilde en uygun özellikleri seçmek için meta-sezgisel yöntemin yardımıyla beyin tümörü. Birkaç önceden eğitilmiş evrişimli sinir ağı (CNN) AlexNet, GoogleNet, ResNet 50 ve DenseNet 201'in ilk kombinasyonu, üç tür Meta-Sezgisel Algoritma Karınca Kolonisi Optimizasyon algoritması (ACO), Particle Swarm Optimization algoritması (PSO), ve Genetik Algoritma (GA). İkinci kombinasyon, verilerin orijinal performansını korurken veri kümesinin boyutunu küçültmeyi amaçlayan yenilikçi bir yöntem olan üç tür Meta Sezgisel Algoritma ACO, PSO ve GA ile Otomatik kodlayıcıydı. Doğru bir teşhis gerçekleştirmek için meta-sezgisel algoritmalar ve denetimli makine öğrenimi algoritmaları ile birlikte derin öğrenme yöntemlerinin kullanılması. Özellik çıkarımı için önceden eğitilmiş evrişimli sinir ağları (CNN'ler) veya otomatik kodlayıcı kullanılırken, özellik seçimi ACO veya PSO veya GA kullanılarak gerçekleştirilir. Karınca kolonisi optimizasyonu, veri miktarını azaltırken en iyi optimum özelliklerin vii aranmasına yardımcı olur. Son olarak, tanı tahmini (sınıflandırma), öğrenilebilir sınıflandırıcılar kullanılarak gerçekleştirilir. Özelliklerin çıkarılması ve seçilmesi için yeni çerçeve, derin öğrenme, otomatik kodlayıcı ve ACO'ya dayanmaktadır. Önerilen kombinasyonun performansı, iki tıbbi görüntü veri seti kullanılarak karar ağacı (DT), destek vektör makinesi (SVM), k-en yakın komşular (KNN), topluluk, Naive Bayes ve diskriminant gibi sınıflandırıcılarla değerlendirilir: göğüs röntgeni (COVID-19 ve beyin tümörlerinin varlığının tahmini için CXR) ve manyetik rezonans görüntüleme (MRI). Doğruluk, önerilen yaklaşımın performansını mevcut son teknoloji yöntemlerle karşılaştırmak için ana ölçü olarak kullanılır. Önerilen sistem, sırasıyla COVID-19 ve beyin tümörlerinin varlığını teşhis etmede diğer tüm yöntemleri geride bırakarak ortalama %99,61 ve %99,18 doğruluk elde ediyor. Elde edilen sonuçlara dayanarak, doktorların veya radyologların önerilen yaklaşımı COVID-19 hastalarının ve spesifik beyin tümörü olan hastaların teşhisinde güvenle kullanabilecekleri söylenebilir. Ayrıca bu tezde, farklı derin öğrenme tekniklerinin meta-sezgisel algoritma ile bir kombinasyonu, evrişimli sinir ağı veya otomatik kodlayıcı derin öğrenme yöntemlerinin her biri, iki farklı tıbbi veri setinden etkili özellikleri çıkarmak için uygulandı. Parçacık Sürü Optimizasyon Algoritması (PSO) tarafından elde edilen optimal özellikleri seçmek için meta-sezgisel yöntemin yardımıyla, yenilikçi bir yöntem olarak kabul edilen bu kombinasyon, verilerin orijinal performansını korurken veri kümesinin boyutunu küçültmeyi amaçlamaktadır. Kovid-19 veri seti, CNN-PSO SVM kombinasyonu ile en yüksek doğruluğun %99,76 olduğunu ve ortak beyin tümörü veri seti için en yüksek doğruluk olarak %99,51'lik doğruluğun, otomatik kodlayıcı-PSO-KNN kombinasyon yöntemiyle elde edildiğini buldu. . Derin öğrenme yönteminin PSO özellik seçim algoritması ile kombinasyon modelinin, ACO algoritması ile aynı yönteme göre çok daha uzun zaman aldığını ve aynı zamanda PSO'nun doğruluğunun ACO doğruluğuna yakın olduğunu fark ettik.
ÖZ: Tıp, bilgisayar bilimindeki ilerlemenin önemli ilerleme kaydettiği alanlardan biridir. Bilgisayarların Tıpta kullanımı kesinliği artırır ve veri işlemeyi ve teşhisi hızlandırır. Şu anda, derin öğrenme algoritmalarının önemli bir rol oynadığı çeşitli bilgisayar destekli teşhis sistemleri bulunmaktadır. Daha hassas ve daha hızlı sistemlere ihtiyaç vardır. Bilgisayar destekli teşhis (CAD), yıllar içinde teşhis tahmini için etkili ve doğru bir yöntem olduğunu kanıtlamıştır. Bu çalışma, teşhisi olabildiğince doğru bir şekilde gerçekleştirmek amacıyla otomatik bir CAD sisteminin geliştirilmesine odaklanmaktadır. Derin öğrenme yöntemleri, tıbbi görüntü veri kümeleri üzerinde etkileyici sonuçlar üretebilmiştir. Bu tezde, iki farklı tıbbi veri kümesinden COVID 19, ve birkaç tıbbi veri seti tespitini kapsayacak şekilde en uygun özellikleri seçmek için meta-sezgisel yöntemin yardımıyla beyin tümörü. Birkaç önceden eğitilmiş evrişimli sinir ağı (CNN) AlexNet, GoogleNet, ResNet 50 ve DenseNet 201'in ilk kombinasyonu, üç tür Meta-Sezgisel Algoritma Karınca Kolonisi Optimizasyon algoritması (ACO), Particle Swarm Optimization algoritması (PSO), ve Genetik Algoritma (GA). İkinci kombinasyon, verilerin orijinal performansını korurken veri kümesinin boyutunu küçültmeyi amaçlayan yenilikçi bir yöntem olan üç tür Meta Sezgisel Algoritma ACO, PSO ve GA ile Otomatik kodlayıcıydı. Doğru bir teşhis gerçekleştirmek için meta-sezgisel algoritmalar ve denetimli makine öğrenimi algoritmaları ile birlikte derin öğrenme yöntemlerinin kullanılması. Özellik çıkarımı için önceden eğitilmiş evrişimli sinir ağları (CNN'ler) veya otomatik kodlayıcı kullanılırken, özellik seçimi ACO veya PSO veya GA kullanılarak gerçekleştirilir. Karınca kolonisi optimizasyonu, veri miktarını azaltırken en iyi optimum özelliklerin vii aranmasına yardımcı olur. Son olarak, tanı tahmini (sınıflandırma), öğrenilebilir sınıflandırıcılar kullanılarak gerçekleştirilir. Özelliklerin çıkarılması ve seçilmesi için yeni çerçeve, derin öğrenme, otomatik kodlayıcı ve ACO'ya dayanmaktadır. Önerilen kombinasyonun performansı, iki tıbbi görüntü veri seti kullanılarak karar ağacı (DT), destek vektör makinesi (SVM), k-en yakın komşular (KNN), topluluk, Naive Bayes ve diskriminant gibi sınıflandırıcılarla değerlendirilir: göğüs röntgeni (COVID-19 ve beyin tümörlerinin varlığının tahmini için CXR) ve manyetik rezonans görüntüleme (MRI). Doğruluk, önerilen yaklaşımın performansını mevcut son teknoloji yöntemlerle karşılaştırmak için ana ölçü olarak kullanılır. Önerilen sistem, sırasıyla COVID-19 ve beyin tümörlerinin varlığını teşhis etmede diğer tüm yöntemleri geride bırakarak ortalama %99,61 ve %99,18 doğruluk elde ediyor. Elde edilen sonuçlara dayanarak, doktorların veya radyologların önerilen yaklaşımı COVID-19 hastalarının ve spesifik beyin tümörü olan hastaların teşhisinde güvenle kullanabilecekleri söylenebilir. Ayrıca bu tezde, farklı derin öğrenme tekniklerinin meta-sezgisel algoritma ile bir kombinasyonu, evrişimli sinir ağı veya otomatik kodlayıcı derin öğrenme yöntemlerinin her biri, iki farklı tıbbi veri setinden etkili özellikleri çıkarmak için uygulandı. Parçacık Sürü Optimizasyon Algoritması (PSO) tarafından elde edilen optimal özellikleri seçmek için meta-sezgisel yöntemin yardımıyla, yenilikçi bir yöntem olarak kabul edilen bu kombinasyon, verilerin orijinal performansını korurken veri kümesinin boyutunu küçültmeyi amaçlamaktadır. Kovid-19 veri seti, CNN-PSO SVM kombinasyonu ile en yüksek doğruluğun %99,76 olduğunu ve ortak beyin tümörü veri seti için en yüksek doğruluk olarak %99,51'lik doğruluğun, otomatik kodlayıcı-PSO-KNN kombinasyon yöntemiyle elde edildiğini buldu. . Derin öğrenme yönteminin PSO özellik seçim algoritması ile kombinasyon modelinin, ACO algoritması ile aynı yönteme göre çok daha uzun zaman aldığını ve aynı zamanda PSO'nun doğruluğunun ACO doğruluğuna yakın olduğunu fark ettik.
Keywords
electrical & electronics engineering