Dieser Artikel beschäftigt sich mit der Vorlesung „Kognitive Systeme“ am KIT. Er dient als Prüfungsvorbereitung. Ich habe die Vorlesungen bei Herrn Dr. Waibel im Sommersemester 2013 gehört.
Behandelter Stoff
Vorlesung
15.04.2013 | Kapitel 1 | Einführung |
17.04.2013 | Faltung, Fouriertransformation, Dirac-Funktion | |
29.04.2013 | Klassifikation I | Schablonenanpassung: Probleme, Statistische Auswertung immer wichtig da Signale ambig sind, Assoziative Netze, Bayes Decision Theorie, Gaussian Classificator - "Covarianzmatrix tut das Richtige [und eliminiert von einander Abhängige Dimensionen]", Mahalanobis-Distanz; Gauss-Klassifikator ist quadratischer Form (Kreis, Ellipse, Linie), Overfitting = "Vorurteil" passiert, wenn man zu wenig Daten bzw. zu viele Dimensionen dafür hat - "Fluch der Dimensionalität"; Hauptachsentransformation reduziert Dimensionalität |
06.05.2013 | Machine Lerning | Klassifikation: Risikobetrachtung bei Klassifikatoren, Gaussian Mixtures, Parzan Windows (nicht-parametrisiert, überwacht), Fisher Linear Discriminant (scatter matrix), Linear seperable, K-nearest neighbors (nicht-parametrisch, nicht-linear, überwacht) |
13.05.2013 | Neural Nets | Perceptron Criterion Function; MLP |
27.05.2013 | Bildverarbeitung I | Lochkartenmodell, HSI-Farbmodell, RGB2HSI, RGB2Graustufen, Histogrammspreizung |
29.05.2013 | Bildverarbeitung II | Pixel-Transformation, Bildverarbeitung, Merkmalsextraktion, Form, Struktur, Klassifikation |
03.06.2013 | (Nicht verfügbar) | 2D-Bildverarbeitung: Schwellwert, Graustufen, Segmentierung, Kanten-/Knotenerkennung; Hough-Tranformation; Harris-Corner-Detector; Kalman-Filter; Erosion / Dilatation; Öffnen / Schließen |
10.06.2013 | (Nicht verfügbar) | Spracherkennung: Lautbildung, Vokale werden durch 1., 2. Formante bestimmt |
24.06.2013 | (Nicht verfügbar) | 3D-Bildverarbeitung: Kalman-Filter; Partikelfilter; homogene Koordinaten |
Falls hier was fehlt, könnt ihr mich gerne in den Kommentaren oder per Mail ([email protected]) darauf aufmerksam machen.
Folien
01: Einführung
Nichts interessantes.
02, 03: Digital Signal Processing
- Alias-Effekt, Abtasttheorem
- Digitalisierung: Zeit- und Wertdiskretisierung
- Dirac-Funktion
- Faltung
- Fouriertransformation
- Korrelation: Autokorrelation, Kreuzkorrelation
04: Intelligente und Kognitive Systeme
Interessant, aber vermutlich nicht Klausurrelevant.
05, 06: Klassifikation
- Schablonenanpassung: Wie ähnlich ist das Muster einer Schablone?
- Normalisierung der Helligkeit
- Gauss-Klassifikation: Parametrisch
- Parzen Window: Nicht parametrisch
- k-nearest-neighbor: nicht parametrisch
- Perceptron: nicht parametrisch
- Bayes-Regel
- Principal Component Analysis (PCA)
- Linear Discriminant Function, Fisher-Linear Discriminant
07, 08: Machine Learning
- Perceptron<: Sigmoidfunktion/li>
- Classifier Discriminant Functions
- Linear Discriminant Functions
09: Bildverarbeitung I
- Bildrepräsentation als Monochrombild
- RGB / HSI-Modell
- Bayer-Pattern
- Lochkamera-Modell
- Affine Punktoperatoren: $g := round(a \cdot I(u,v) + b)
I'(u,v) :=
\begin{cases}
0 &\text{, falls } g < 0\\
q &\text{, falls } g > q\\
g &\text{sonst}
\end{cases}$
- Kontrasterhöhung: $b=0; a > 1$
- Kontrastverminderung: $b=0; a < 1$
- Helligkeitserhöhung: $b>0; a = 1$
- Helligkeitsverminderung: $b<0; a = 1$
- Invertierung: $b=q; a =-1$
- Nicht-Affine Punktoperatoren
- Automatische Kontrastanpassung (Spreizung, Histogrammdehnung, Histogrammausgleich)
10: Bildverarbeitung II
- Fourier-Transformation
- 2D Fourier-Transformation
- Fourier-Rücktransformation
- Ortsbereich / Frequenzbereich
- Tiefpassfilter
- Mittelwertfilter: Rauschunterdrückung
- Gauß-Filter: Rauschunterdrückung, Glättung
- Hochpassfilter
- Prewitt
- Sobel
- Laplace
- Roberts
- KOmbinierte Operatoren
- Laplacian of Gaussian
- Canny-Kantendetektor
11: Bildverarbeitung III
- Segmentierung (Schwelltwert, Farbe)
- Morphologische Operatoren: Dilatation, Erosion
- Öffnen, Schließen
- Hough-Transformation
- Sum of Squared Differences; Zero Mean Normalized Cross-Correlation
- Partikelfilter
12: Spracherkennung
- Faltung
- Formanten
- Spektogramm
- Akustisches Modell, Sprachmodell
- (Hidden-)Markov-Modell
- Forward-, Forward-Backward- und Viterbi-Algorithmus
13: ?
14: ?
15: Bildverarbeitung IV
- Geometrische 3D-Transformationen: Rotation um Achsen
- Quaternionen
- Erweitertes Lochkameramodell
- Kamerakalibrierung
- Diskrete Lineare Transformation
- Stereorekonstruktion
- Epipolargeometrie
- Fundamentalmatrix
16: Visuelle Wahrnehmung
Vermutlich nichts Klausurrelevantes (offiziell ab Folie 25)
17: Wissen und Planung I
- Satz, Wissensdatenbank, Deduktion
- Symbolmenge, Modellmenge, Syntax, Semantik
- Korrektheit und vollständigkeit eines Deduktions-Algorithmus
- Algorithmen: Resolution, Horn-Klauseln, DPLL
- Planungssprachen: STRIPS, ADL
- A*-Suche, Partial-Order-Planning, Planungsgraphen
18: Wissen und Planung II
- Partial-Order-Planning
- Planungsgraphen
- Kantenmodell, Oberflächenmodell, Volumenmodell
- Freiraum, Hindernisraum, Konfigurationsraum
- Polygonzerlegung
- Sichtgraphen
- Quadtrees
- Voronoi-Diagramme
- Potentialfeldmethode
19: Robotik
Offiziell nicht Klausurrelevant.
Material
- Vorlesungswebsite
- Mein Anki-Deck
- Klausuren
- Folien
- Skript
- Zusammenfassung
- Videos
- Pseudocode für
- Colorizer: Hier kann man ein bisschen mit Farbräumen rumspielen und die Unterschiede interaktiv feststellen.
- StackOverflow:
- Artikel:
- Graphic filters: Mit einem interaktiven Beispiel aller Filter!
- Clustering-Algorithmen: Mit interaktivem Beispiel
- Calculations with quaternions
- How do I calculate a histogram equalization?
- How to apply the Viterbi algorithm
- Interactive example for route planning
- Word Error Rate (WER) calculation
- Grafische Faltung:
- John Hopkins University, Java Applet
- onmyphd.com, JavaScript
Das Passwort für kogsys darf ich auch im Jahr 2013 nicht verraten.
Aufbau der Klausur
6 Aufgaben:
- Bildverarbeitung
- Bildverarbeitung, Filter und Transformation
- Logik, Wissensrepräsentation und Planung
- Eine Aufgabe, in der man den Resolutionsalgorithmus / das DPLL-Verfahren anwenden muss
- A*-Algorithmus
- Allgemeine Fragen
- Signal- und Sprachverarbeitung
- Klassifikation und Maschinelles Lernen
Übungsbetrieb
- Wo sind die Übungsblätter: Link
- Abgabeform: nur Handschriftlich
- Abgabe: teilweise online, teilweise offline, wenn offline müssen die Übungsblätter direkt vor der Übung abgegeben werden, oder irgendwann davor im Büro des Übungsleiters in der Kinderklinik. Direkt im Büro scheint ihm aber nicht so lieb zu sein.
- Rücknahme: gar nicht, empfohlen wird eine Kopie des Originals zu behalten
- Turnus: ? (6 Blätter insgesammt)
- Übungsschein verpflichtend: es gibt keinen Übungsschein soweit ich weiß
- Bonus durch Übungsschein: pro Übungsblatt max. 1 Bonuspunkt → max. 6 Bonuspunkte (es gibt tatsächlich 0,25-Punkte!)
Termine und Klausurablauf
Datum: Mittwoch, den 18. September 2013 von 11:00 bis 12:00 Uhr
Ort: steht noch nicht fest (Stand: 12.09.2013)
Punkte: 60
Bestehensgrenze: 20
Übungsschein: Gibt es nicht
Bonuspunkte: Ja, max 6
Ergebnisse: ab 14.10.2013 im Websubmit und in 50.20. (Kinderklinik) am Eingang
Einsicht: 24.10.2013 von 13:30 bis 14:30 Uhr (Kinderklinik, Raum 148)
Nicht vergessen
- Studentenausweis
- Kugelschreiber
Ergebnisse
Sind noch nicht draußen (Stand: 18.09.2013)