ich wollte endlich mal mein Defizit in Sachen KI verringern und hatte mit die https://github.com/joaopauloschuler/neural-api heruntergeladen. Das ist schon beeindruckend was das so kann.
Trotz vieler Beispiele verstehe ich davon nicht viel. Wie so eine KI grundsätzlich funktioniert habe ich verstanden, nur die Wege zu den Beispielen bleiben mir verborgen.
Hier einige Zeilen aus dem SimpleImageClassifier:
Code: Alles auswählen
NN := TNNet.Create();
NN.AddLayer([
TNNetInput.Create(32, 32, 3),
TNNetConvolutionLinear.Create({Features=}64, {FeatureSize=}5, {Padding=}2, {Stride=}1, {SuppressBias=}1),
TNNetMaxPool.Create(4),
TNNetMovingStdNormalization.Create(),
TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
TNNetConvolutionReLU.Create({Features=}64, {FeatureSize=}3, {Padding=}1, {Stride=}1, {SuppressBias=}1),
TNNetDropout.Create(0.5),
TNNetMaxPool.Create(2),
TNNetFullConnectLinear.Create(10),
TNNetSoftMax.Create()
]);
Offensichtlich handelt es sich bei den Elemente "ConvolutionLinear", "MaxPool", "ConvolutionReLU", etc. um feststehende Begriffe, deren Hintergründe als bekannt vorausgesetzt werden. Sucht man im Netzt nach diesen Begriffen, landet man relativ schnell auf Seiten wie dieser https://www.nickmccullum.com/python-dee ... r-pooling/, die auf eine Python Implementierung hinweisen, die auf diesen Elementen beruht.
Deshalb meine Frage an Euch, ob mir jemand Literatur (Gerne englischsprachig) empfehlen kann, in denen insbesondere diese Aspekte erläutert werden?
Auch hier finde ich natürlich bei der Internetsuche einige Werke, aber leider kann ich nicht erkennen, ob die o.a. Aspekte enthalten sind.
Vielen Dank!