CENG0046 Text Vectorization

6 AKTS - 3-0 Süre (T+U)- . Yarıyıl- 3 Yerel Kredi

Genel Bilgi

Kod CENG0046
Ad Text Vectorization
Yarıyıl . Yarıyıl
Süre (T+U) 3-0 (T-U) (17 Hafta)
AKTS 6 AKTS
Yerel Kredi 3 Yerel Kredi
Eğitim Dil İngilizce
Seviye Doktora Dersi
Tür Normal
Öğretim Şekli Yüz Yüze Öğretim
Bilgi Paketi Koordinatörü Prof. Dr. UMUT ORHAN


Dersin Amacı

Öğrenci kelime, cümle ve dökümanların sayısal olarak temsilini sağlayan metin vektörleşme yöntemlerini öğrenerek derin öğrenmeye dayalı doğal dil işleme problemlerinde başarının artmasını sağlar. Tüm bu süreçte bağlamın önemini ve seyrekliği düşük hesaplama yöntemlerine odaklanmayı öğrenir.

Dersin İçeriği

Vector Space Model and One-hot vectors, Sense Representation Problem and Synset Embedding, Sparsity Problem, Word Embedding Methods (Word2Vec, Glove, FastText), Contextualized Text Embeddings (BERT, ELMO, GPT-x), Synset Based Contextual Embedding (Generalized SemSpace)

Dersin Ön Koşulu

yok

Kaynaklar

State of the art papers

Notlar

Daniel Jurafsky and James H. Martin, Speech and language processing an introduction to natural language processing, computational linguistics, and speech, 2000.


Dersin Öğrenme Çıktıları

Sıra Dersin Öğrenme Çıktıları
ÖÇ01 Kelime ve anlam gömme kavramlarını öğrenir
ÖÇ02 Bağlamsallaştırmayı anlar
ÖÇ03 Metin temsilinin yararlarını yorumlar
ÖÇ04 En yeni teknolojik yöntemleri metinlere uygular


Program Öğrenme Çıktıları ile İlişkisi

Sıra Tür Program Öğrenme Çıktıları Duzey
PÖÇ01 Bilgi - Kuramsal, Olgusal Lisans düzeyinde kazanılan yetkinlikler temelinde Bilgisayar Mühendisliği temel alanında özgün çalışmalar için gerekli temeli sağlayan ileri düzeyde bilgi ve kavrayışa sahiptir. 3
PÖÇ02 Bilgi - Kuramsal, Olgusal Mühendislik alanında bilimsel araştırma yaparak bilgiye genişlemesine ve derinlemesine ulaşır, bilgiyi değerlendirir, yorumlar ve uygular. 3
PÖÇ03 Yetkinlikler - Öğrenme Yetkinliği Mesleğinin yeni ve gelişmekte olan uygulamalarının farkında olup, gerektiğinde bunları inceler ve öğrenir. 2
PÖÇ04 Yetkinlikler - Öğrenme Yetkinliği Mühendislik problemlerini kurgular, çözmek için yöntem geliştirir ve çözümlerde yenilikçi yöntemler uygular. 4
PÖÇ05 Yetkinlikler - Öğrenme Yetkinliği Analitik, modelleme ve deneysel esaslı araştırmaları tasarlar ve uygular, bu süreçte karşılaşılan karmaşık durumları çözümler ve yorumlar.
PÖÇ06 Yetkinlikler - Öğrenme Yetkinliği Yeni ve/veya özgün fikir ve yöntemler geliştirir, sistem, parça veya süreç tasarımlarında yenilikçi çözümler geliştirir. 4
PÖÇ07 Beceriler - Bilişsel, Uygulamalı Öğrenme becerilerine sahip olur. 3
PÖÇ08 Beceriler - Bilişsel, Uygulamalı Bilgisayar Mühendisliğinin yeni ve gelişmekte olan uygulamalarının farkında olup gerektiğinde bunları inceler ve öğrenir. 2
PÖÇ09 Beceriler - Bilişsel, Uygulamalı Çalışmalarının süreç ve sonuçlarını Bilgisayar Mühendisliği alanındaki veya alan dışındaki ulusal ve uluslararası ortamlarda açık bir şekilde yazılı veya sözlü olarak aktarır. 3
PÖÇ10 Beceriler - Bilişsel, Uygulamalı Bilgisayar Mühendisliğinde uygulanan güncel teknik ve yöntemler ile bunların kısıtları hakkında kapsamlı bilgiye sahip olur. 4
PÖÇ11 Beceriler - Bilişsel, Uygulamalı Bilgisayar Mühendisliğinin gerektirdiği düzeyde bilgisayar yazılımı ile birlikte bilişim ve iletişim teknolojilerini ileri düzeyde etkileşimli olarak kullanır. 4
PÖÇ12 Bilgi - Kuramsal, Olgusal Mesleki tüm etkinliklerde toplumsal, bilimsel ve etik değerleri gözetir.


Haftalık Akış

Hafta Konu Ön Hazırlık Yöntemler
1 Vector Space Model Makale okuma Öğretim Yöntemleri:
Anlatım
2 One-hot vectors Makale okuma Öğretim Yöntemleri:
Anlatım
3 Word-Sense Representation Problem Makale okuma Öğretim Yöntemleri:
Anlatım
4 Word-Synset Embedding Makale okuma Öğretim Yöntemleri:
Anlatım
5 Sparsity Problem Makale okuma Öğretim Yöntemleri:
Anlatım
6 Word Embedding Apps (Word2Vec, Glove, FastText) Makale okuma Öğretim Yöntemleri:
Deney / Laboratuvar
7 Contextualized Text Embeddings Makale okuma Öğretim Yöntemleri:
Anlatım
8 Ara Sınavlar Tüm ders notlarını okumak Ölçme Yöntemleri:
Yazılı Sınav
9 Contextualized Apps (BERT, ELMO, GPT-x) Makale okuma Öğretim Yöntemleri:
Deney / Laboratuvar
10 Synset Based Contextual Embedding (Generalized SemSpace) Makale okuma Öğretim Yöntemleri:
Anlatım
11 Projects 1 Proje hazırlamak Ölçme Yöntemleri:
Proje / Tasarım
12 Projects 2 Proje hazırlamak Ölçme Yöntemleri:
Proje / Tasarım
13 Projects 3 Proje hazırlamak Ölçme Yöntemleri:
Proje / Tasarım
14 Projects 4 Proje hazırlamak Ölçme Yöntemleri:
Proje / Tasarım
15 Projects 5 Proje hazırlamak Ölçme Yöntemleri:
Proje / Tasarım
16 Yarıyıl Sonu Sınavları Tüm ders notlarını okumak Ölçme Yöntemleri:
Yazılı Sınav
17 Yarıyıl Sonu Sınavları Tüm ders notlarını okumak Ölçme Yöntemleri:
Yazılı Sınav


Öğrenci İş Yükü - AKTS

Çalışmalar Sayısı Süresi (Saat) İş Yükü (Saat)
Ders ile İlgili Çalışmalar
Ders (Sınav haftaları dahil değildir) 14 3 42
Sınıf Dışı Ders Çalışma (Ön çalışma, pekiştirme) 14 2 28
Değerlendirmeler ile İlgili Çalışmalar
Ödev, Proje, Diğer 3 15 45
Ara Sınavlar (Yazılı, Sözlü, vs.) 1 15 15
Yarıyıl/Yıl Sonu/Final Sınavı 1 15 15
Toplam İş Yükü (Saat) 145
Toplam İş Yükü / 25 (s) 5,80
AKTS 6 AKTS