MeanNearestNeighbors (MNN) - algorithm for balancing dataset - In progress #1

Image
One of the challenges in classification problems are unbalanced datasets. I was Data Science Intern when the company that I worked for, assigned me such an interesting challenge where the dataset was unbalanced.  However, I realized this type of problem like unbalanced dataset is а common thing in real life. I tried most of the algorithms (undersampling, oversampling) like SMOTE, NearMiss, CondensedNearestNeighbors, RandomUnderSampler, RandomOverSampler,  KMeansSMOTЕ and rest of them. Anyway, they didn't help me in that case, on the contrary, they worsened my model.  I was like: "but, but, you should have been helpful in creating the predictive model" So, I'm trying to create another algorithm based on undersampling concept when it comes to balancing datasets. I called it Mean Nearest Neighbors (MNN). What's the initial idea: It's simple. Actually, the algorithm is just a modification of the other undersampling algorithms. In the data where target labe...

Intro to Quantum Computing: Што ќе ми треба ова сега? #1

    Да, точно е дека сега нема да ти треба ова. Но, за едно 5-6 години ќе сфатиш дека ова е иднината. Ова ќе биде дел од футуристичката технологија. На Harvard, MIT веќе постојат курсеви и книги за квантно сметање. Веќе постои програмски јазик за квантно програмирање. Провери Q# од Microsoft. Веќе се развиваат квантни алгоритми... Различни области кои почнуваат со зборот Quantum. Еве неколку: AI, Machine Learning, Networking, Cryptography и многу повеќе. 



    Поразлична е од оваа класична технологија. Пример, ако знаеме дека во класичната технологија информацијата се претставува со два бита 0 и 1, во квантум се користат кјубита и еден кјубит може истовремено да биде 0 или 1. Чудно, нели? Тоа е магијата овде. 



    Како и да е, тоа не значи дека ќе се исфрли десктоп компјутер, или дека за џабе е се учење сега, ако знаеме дека за 15 години доаѓа технологија која ќе писка низ светов.

    IBM, Google, Microsoft, Intel, HP, Alibaba даваат најмногу напор за развиток на оваа технологија, како и нејзино рекламирање. Јакото е што, IBM нудат бесплатно користење на нивниот квантум компјутер.

    

Секако бара предзнаење.. најмногу математика, физика исто така се смета за голем плус

    - Основи на квантна механика
    - Линеарна алгебра
    - Теорија на групите (Group Theory)
    - Веројатност и случајни процеси
    - Фуриеви трансформации
    - Дизајн и анализа на алгоритми

Добри книгичиња има:


https://www.amazon.com/Quantum-Computer-Science-David-Mermin/dp/0521876583
https://www.amazon.com/Quantum-Computing-Computer-Scientists-Yanofsky/dp/0521879965












Popular posts from this blog

Math Problem -> Combinatorics: Foreign alphabet

Competitive Programming #29 : [LineUp]