Comment gérer les LSTM avec de nombreuses fonctionnalités en python?

EmJ

J'ai un problème de classification binaire. J'utilise le modèle de keras suivant pour faire ma classification.

input1 = Input(shape=(25,6))
x1 = LSTM(200)(input1)
input2 = Input(shape=(24,6))
x2 = LSTM(200)(input2)
input3 = Input(shape=(21,6))
x3 = LSTM(200)(input3)
input4 = Input(shape=(20,6))
x4 = LSTM(200)(input4)
x = concatenate([x1,x2,x3,x4])
x = Dropout(0.2)(x)
x = Dense(200)(x)
x = Dropout(0.2)(x)
output = Dense(1, activation='sigmoid')(x)

Cependant, les résultats que j'obtiens sont extrêmement mauvais. Je pensais que la raison était que j'avais trop de fonctionnalités, donc les besoins ont plus de couches améliorées après le concatenate.
Je me demandais également s'il serait utile d'utiliser un calque flatten () après le concatenate.
de toute façon, comme je suis nouveau dans le deep learning, je ne sais pas trop comment en faire un meilleur modèle.

Je suis heureux de fournir plus de détails si nécessaire.

Ronakrit W.

Voici ce que je peux suggérer

Supprimez tous les éléments qui empêchent le surajustement, comme le décrochage et le régularisateur. Ce qui peut arriver, c'est que votre modèle ne sera peut-être pas en mesure de capturer la complexité de vos données en utilisant une couche donnée, vous devez donc vous assurer que votre modèle est capable de sur-ajuster avant d'ajouter le régulariseur.
Maintenant, essayez d'augmenter le nombre de couche dense et le nombre de neurones dans chaque couche jusqu'à ce que vous puissiez voir une amélioration. Il est également possible que vos données soient trop bruyantes ou que vous n'ayez que peu de données pour entraîner le modèle, de sorte que vous ne pouvez même pas produire de prédictions utiles.
Maintenant, si vous êtes chanceux et que vous pouvez voir un surajustement, vous pouvez ajouter Dropout et régularisateur.

Étant donné que chaque réseau de neurones est un algorithme de base de gradient, vous pouvez vous retrouver au minimum local. Vous devrez peut-être également exécuter l'algorithme plusieurs fois avec un poids initial différent avant de pouvoir obtenir un bon résultat ou vous pouvez modifier votre fonction de perte afin que vous ayez un problème convexe où le minimum local est le minimum global.

Si vous ne pouvez pas obtenir un meilleur résultat

Vous devrez peut-être essayer une topologie différente car LSTM essaie simplement de modéliser un système qui suppose avoir la propriété Markov. vous pouvez regarder imbriqué-LSTM ou quelque chose comme ça, qui modélise le système de la façon dont le prochain pas de temps ne dépend pas seulement du pas de temps actuel.

Comment gérer les fonctionnalités catégorielles avec de nombreuses valeurs uniques dans Python / Scikit Learn

Django0602 Dans ma situation, je voudrais encoder environ 5 colonnes différentes dans mon ensemble de données mais le problème est que ces 5 colonnes ont de nombreuses valeurs uniques. Si je les code à l'aide de l'encodeur d'étiquettes, j'ajoute un ordre inuti

Comment gérer correctement les fonctionnalités optionnelles en python

Jérémie Je travaille sur des packages python qui implémentent des modèles scientifiques et je me demande quelle est la meilleure façon de gérer les fonctionnalités optionnelles. Voici le comportement que j'aimerais: si certaines dépendances optionnelles ne peu

Comment générer une liste de nombres aléatoires avec de nombreuses valeurs nulles en Python ?

Yasaman Gandhi Je veux ajouter deux listes de nombres aléatoires en python. La première liste est construite avec une centaine de valeurs aléatoires. La deuxième liste ne devrait avoir que 4 ou 5 valeurs aléatoires et le reste devrait être 0. Ensuite, je veux

Générer une liste de toutes les combinaisons en remplaçant un personnage avec de nombreuses possibilités

E.Menges Je voudrais générer une nouvelle colonne d'un bloc de données contenant une liste de toutes les combinaisons en remplaçant un caractère avec de nombreuses possibilités par exemple: J'ai une table générée en utilisant ce code: x <- expand.grid(rep(list

Comment puis-je transformer Dataframe en de nombreuses fonctionnalités temporelles en Python ?

utilisateur3053236 j'ai ce dataframe : Timestamp DATA0 DATA1 DATA2 DATA3 DATA4 DATA5 DATA6 DATA7 0 1.478196e+09 219 128 220 27 141 193 95 50 1 1.478196e+09 95 237 27 121 90 194 232 137 2 1.478196e+09 193 22 103 217 138

Comment gérer avec élégance les futures importations de fonctionnalités (future) échouées en raison de l'ancienne version de l'interpréteur?

cdleary: Comment gérez-vous avec élégance les futures importations de fonctionnalités qui ont échoué? Si un utilisateur utilise Python 2.5 et que la première instruction de mon module est: from __future__ import print_function La compilation de ce module pour

Utilisez les fonctionnalités sélectives d'un JavaRDD avec de nombreuses fonctionnalités

Keyur Golani J'utilise Spark Mllib avec Hadoop dans l'une des applications d'analyse Big Data. J'ai un ensemble de fonctionnalités de 41 fonctionnalités et une étiquette. Maintenant, pendant la formation, je souhaite mélanger et assortir mes fonctionnalités à

comment améliorer les performances lors de l'insertion de nombreuses fonctionnalités dans une carte avec leaflet.js

stéros Avec le code prototype ci-dessous, j'ajoute de nombreuses fonctionnalités par étapes dans un osm. J'y charge environ 8500 entités multipolygones. Certains d'entre eux ont beaucoup de coordonnées, ce qui représente environ 150 Mo de données textuelles au

Identifier les colonnes de fonctionnalités avec des valeurs infinies et les gérer dans les pandas, Python 3.6

RAM Il y a des tonnes de questions et réponses sur ce sujet mais je ne parviens pas à résoudre mon problème. J'essaie d'utiliser le modèle ADASYN d'imblearn pour équilibrer mon ensemble de données. Voici mon code pour l'instant: df = pd.read_csv("data/"+fi

Comment gérer les LSTM avec de nombreuses fonctionnalités en python?

Articles connexes

liste