Kategoriler: Yapay Zekâ (AI), Yatırım, Dijital Para
Vectorspace, alternatif veri setleri ve ‘özellik mühendisliği’ platformu sunan bir makine öğrenimi ve finansal bilişim şirketidir.
Ethereum tabanlı bir projedir.
Özellik mühendisliği (feature engineering), verilerdeki mevcut ham özelliklerden ek ilgili özellikler oluşturmaya ve öğrenme algoritmasının tahmin gücünü artırmaya çalışır.
Biraz teknik olsa da projenin daha iyi anlaşılması adına şu açıklamalar önemli:
Vector Space Modeli, bir indeks teriminin vektörü olarak metin dokümanlarını sunan cebirsel bir modeldir. Bilgisayar bilimlerinde özellikle Bilgi Erişimi (Information Retrieval), doğal dil işleme (Natural Language Processing, NLP) ve metin madenciliği (text mining) gibi konularda kullanılır.
Metin dokümanlarının vektörler ile ifade edildiği bir uzay düşünün. Bu sayede:
- Aradığınız bir metni bu uzay düzlemindeki yerini bulabilirseniz bu vektöre en yakın dokümanlara erişebilirsiniz.
- Dokümanlar arası uzaklığı birbiri ile kıyaslayabilirsiniz.
- k-means clustering uygulayarak belgelerinizi belli gruplara ayırabilirsiniz.
Misyon
Ekip bağlam kontrollü NLP ve NLU’ya (Doğal Dil İşleme ve Anlama) odaklanarak Yapay Zekâ ve Makine Öğreniminde gelişmiş yaklaşımları güçlendirmek amacıyla verilerde gizli ilişki tespiti için özellik mühendisliği yapıyor.
Vectorspace platformu, talep üzerine NLP/NLU korelasyon matrisi veri kümeleri oluşturarak araştırma gruplarına, veri satıcılarına, fonlara ve kurumlara güç sağlıyor.
Makinelerin birbirleriyle bilgi alışverişinde bulunmalarını veya seçilen bir kayıp fonksiyonunu en aza indirecek şekilde veri alışverişi ve işlem yapmalarını hedefliyorlar.
Amaçları, bir hipotezi test ederek veya daha yüksek verimle deneyler gerçekleştirerek verileri analiz eden “herhangi bir grubun” zaman kazanmasını sağlamak.
Ekip böylece inovasyon hızını, yeni bilimsel buluşları ve keşifleri artırabileceklerini düşünüyor.
Nasıl Çalışıyor?
Platform; haber, bilgi kaynakları ve hakemli bilimsel literatürü gerçeğe yakın zamanlı olarak tarıyor. Daha sonra bu verileri işleyip indeksler oluşturuyor, ilişkileri hesaplayıp ve bir API yoluyla mevcut güncellenmiş veri kümeleri çıkarıyor.
Verilerinizin nereden geldiğini ve ne kadar güvenilir olduğunu bilmek, özellikle milyar dolarlık kararlar almak için güçlü verilere dayanan Biyo-bilim ve finans alanlarında son derece önemlidir. Ekip bu veri kaynakları için Data Provenance Pipeline (DPP) adında veri kontrol sistemi geliştirmiş.
Projede kullanılan algoritmalar NLP, NLU ve Makine Öğrenimi uygulamalarında kanıtlanmış değişkenlere dayanıyor. Bu değişkenlerden bazılarının kökeni Vectorspace ekibinin Lawrence Berkeley Ulusal Laboratuvarı iş birliği ile icat ettiği “İlişki Ağı Oluşturmak için Sistem ve Yöntem” adındaki patente dayanıyor. Google ve diğerleri 2010 yılında bunun türevlerini oluşturmuş.
Kullanım Durumları için şu sayfaya göz atınız:
Akıllı Sepetler
Vectorspace bağlam kontrollü korelasyon matrisi veri kümeleri, ‘Akıllı Sepetler’ oluşturmak için kullanılabilir.
Bunlar, hisse senedi veya kripto para birimleri gibi varlık gruplarıdır.
Hisse senetleri, varlıklar ve küresel olaylar arasındaki gizli ilişkilerin duygusal, simbiyotik ve daha pek çok unsur ve gizli ilişkilere dayalı olarak algılanması, ‘bilgi arbitrajı’ ile bağlantılı benzersiz fırsatlara yol açabilir.
VXV
Vectorspace projesinin kendi token’ı olan VXV yukarıda değindiğim bütün hizmetlerde ödeme aracı olarak kullanılacak.
Platform üzerinde “akıllı token sepetleri” oluşturmanız da mümkün.
Kullanıcıların web aramaları, sosyal medya ve haberlerdeki eğilimlerine göre oluşturulmuş dinamik token sepetleri yapabilirsiniz. Bu sepet, “gelirinizi artırmak için” ek kripto para ilave edilip edilmeyeceğine veya başka bileşenlere ihtiyaç duyulup duyulmadığına kendisi karar verip işlem yapıyor. Bu işlemlerin gerçekleştirmesi için VXV utility token’ı kullanılıyor.
Trader’lar, yatırımcılar ve fonlar, çeşitli indikatör ve tercihe dayalı olarak oluşturulan algoritmalar ile filtreler uygulayarak sepet getirilerini optimize edebilir.
Ayrıca aylık olarak en iyi sepet performansı gösteren kullanıcılar da VXV token’larıyla ödüllendirilecekler.
Partnerler
- Lawrence Berkeley National Laboratory
- US Dept. of Energy (DOE)
- National Library of Medicine (NLM)
- The European Molecular Biology Laboratory (EMBL)
- Bitvore
- Pushshift.io
Projenin patent, bildiri ve ödüllerinden bazıları:
- Winner R&D100 Award – Lawrence Berkeley National Laboratory
- System and method for generating a relationship network – K Franks, CA Myers, RM Podowski – US Patent 7,987,191, 2011
- Inter-term relevance analysis for large libraries
- Matching and recommending relevant videos and media to individual search engine results
- Media discovery and playlist generation
- System and method for summarizing search results
- Discovering and scoring relationships extracted from human generated lists
- Statistical modeling of biomedical corpora: mining the Caenorhabditis Genetic Center Bibliography for genes related to life span – Blei DM, Franks K, Jordan MI, Mian IS.
- A Search Engine that Thinks, Almost
Ekip
Web sitesinde yönetici ekipten üç kişi görünüyor.
***
Twitter’a giriş tarihleri Mart 2019. Takipçi sayıları 606.
Telegram’da bu sayı 952, Reddit’te 141.
Bilinirliğinin şu an için oldukça az olduğunu söyleyebilirim.