Study Group in French

Salut :smiley: Je suis Ă  Antibes et en train de recherche un premier job en Data Scientist

Bonjour a tous !
Je serai ravi de rejoindre ce groupe.

Yop
Chaud aussi pour rejoindre le groupe!
Il y a t’il un slack/discord ou c’est basĂ© sur du meetup?

Salut !
Y a-t-il des live viewers en ce moment ? :slight_smile:

Bonjour a tous. ie je suis du danemark et parle francais

Hi everyone,
I live in Tours if anyone wants to make an in person study group.

free credits are only for those taking the course in person?

It seems that if you sign up to GCP you will get free credit. but I’m not sure for AWS.

On AWS you have the free tier for most services during the first year but I thought they were giving free credits to students :smiley:

Comment voulez-vous qu’on s’organise ? Est-ce qu’on fait une conversation sur ce forum comme Jeremy l’a suggĂ©rĂ© ?

Oui on peut faire ça, je pense qu’il n’est pas nĂ©cessaire de reproduire le thread : Lesson 1: class discussion and resources
Nos threads pourrait se concentrer sur les questions/avancées liées à chaque leçon.

Bienvenu !
Il n’y a rien d’autre que cette discussion pour le moment.

Que diriez-vous de faire un Hangout vidéo ce mercredi à 21h (heure de Paris) pour discuter du cours de cette nuit ?

2 Likes

Pour ceux que ça intĂ©resse j’ai crĂ©Ă© un dataset d’avions A380 et B747 lors de la version prĂ©cĂ©dente du cours :
https://github.com/trancept/deep_learning_tests/blob/master/012-Binary_Classification_747_vs_A380-essential.ipynb (Aujourd’hui l’affichage n’a pas l’air de fonctionner dans GitHub
)
Je suis ne train de le refaire avec la nouvelle version d’API.
Si ça vous intéresse je peux vous partager le dataset. Les images viennent de Google Image.

Bonjour Ă  tous,
je suis de la région de Strasbourg.
C’est mon premier cours de fast.ai que je suis. (depuis le temps que je m’y intĂ©resse ^^)
Je connais Python mais pas encore la librairie PyTorch.
Mon background : ingé info.

J’ai commencĂ© Ă  regarder la vidĂ©o du cours.
Une bonne partie du dĂ©but de la vidĂ©o concerne la mise en place du cours en prĂ©sentiel dĂ©jĂ  30 min. vous pouvez zapper le dĂ©but ! (ça commencera Ă  l’heure exacte pour les prochaines sessions)

Ceux sur place doivent s’organiser en groupe de 6.

Ceux suivant en live le font sur un groupe d’étude, nous par exemple qui frĂ©quentons ce fil de discussion formons un groupe d’étude, mais j’imagine que vous pouvez vous organiser pour des projets prĂ©cis.

Il est proposé de créer/utiliser un outil de collaboration quelconque. Un googlesheet ou autre. Un calendrier pour nos discussions éventuelles live serait éventuellement utile.

L’horaire me va, mais je ne sais pas combien j’aurai avancĂ©.

Je compte faire tourner sur ma propre machine, j’ai vu un tuto qui semblait pas trop long. Bien que l’option cloud payant soit tentante (mais aucune idĂ©e de combien d’heures totales de calcul on va avoir besoin ?!)

Ă  bientĂŽt

Welcome.
Si tu as un GPU et que tu es familier d’Ubuntu c’est effectivement facile d’installer tout le systùme: 4 lignes à copier-coller.
Donc mieux vaut le faire en local si tu es Ă©quipĂ©, c’est ce que je fait. Ca Ă©vite de payer pour rien, tu peux lancer des calculs plus long pour amĂ©liorer la prĂ©cision des modĂšles et faire autant de test que tu veux sans la pression du coĂ»t.

Je suis OK pour le Hangout mercredi.
Je pense que je vais acheter une nouvelle machine pour travailler en local.
Ram 16Go, Intel core i7, NVIDIA GeForce GTX 1070, SSD 480 Go, tu penses que ça suffit ?

ok pout le hangout mercredi

A mon tour de me présenter:
Je suis Ă©tudiant en IngĂ©, j’ai donc forcĂ©ment moins d’expĂ©rience que vous mais je suis bien motivĂ©!
J’ai dĂ©jĂ  utilisĂ© Python et un peu utilisĂ© Pytorch (mais souvent pour des programmes assez simples).
J’ai aussi commencĂ© Ă  m’intĂ©resser aux maths appliquĂ©s qui servent dans le Deep Learning (descente de gradient, convolutions
)
Enfin je suis surtout intĂ©ressĂ© par la partie computer vision du Deep Learning mais j’aime le reste aussi!

Bonjour,

Avec plaisir pour Ă©changer avec celles et ceux qui suivent le cours fastai. Voici une timeline de la vidĂ©o de la lesson 1 d’hier (avec les liens vers les parties correspondantes dans la video).

Accueil

Jeremy Howard

Notebook 1
(https://github.com/fastai/course-v3/blob/master/nbs/dl1/lesson1-pets.ipynb)

  • Etape 2 : crĂ©er le modĂšle (https://www.youtube.com/watch?v=7hX8yKCX6xM&t=5274)
    – crĂ©ation du modĂšle learn qui contient l’architecture du rĂ©seau neuronal et le dataset databunch (on peut y ajouter la mĂ©trique d’évaluation de l’erreur sur le val set)
    – Transfert Learning : on utilise les paramĂštres d’un modĂšle dĂ©jĂ  entraĂźnĂ© Ă  reconnaĂźtre des objets dans des images (resnet34)
    – Overfitting : pour vĂ©rifier que pendant son entraĂźnement notre modĂšle ne se spĂ©cialise pas sur le train set mais apprend bien Ă  reconnaĂźtre les caractĂ©ristiques gĂ©nĂ©rales des objets Ă  dĂ©tecter, on utilise un val set sur lequel on calcule l’erreur (cf. mĂ©trique ci_dessus dans le modĂšle learn)
  • Etape 3 : entraĂźner le modĂšle avec la mĂ©thode fit_one_cycle() et non plus fit() comme dans la version prĂ©cĂ©dente du cours (explication du papier de Leslie Smith dans l’article de @sgugger : The 1cycle policy)

Reprise aprĂšs la pause : https://www.youtube.com/watch?v=7hX8yKCX6xM&t=6536

  • Etape 4 : analyser les prĂ©visions faites par le modĂšle pour comprendre son fonctionnement et Ă©ventuellement l’amĂ©liorer (https://www.youtube.com/watch?v=7hX8yKCX6xM&t=7922)
    – utilisation de l’objet interp instanciĂ© par la mĂ©thode ClassificationInterpretation.from_learner(learn)
    – 3 mĂ©thodes Ă  utiliser sur l’objet interp :
    — plot_top_losse() pour visualiser les images sur lesquelles le modĂšle gĂ©nĂšre une grosse erreur (loss),
    — plot_confusion_matrix() qui affiche la Confusion Matrix,
    — most_confused() qui publie la liste des labels (classes) prĂ©dits avec le plus grand nombre d’erreurs

  • Etape 5 : amĂ©liorer le modĂšle (https://www.youtube.com/watch?v=7hX8yKCX6xM&t=8310)
    – rechercher le meilleur Learning Rate avec la mĂ©thode lr_find() puis recorder.plot() (pour afficher la courbe loss-vs-lr)
    – utiliser alors la mĂ©thode unfreeze() sur le modĂšle learn afin de pouvoir entraĂźner toutes les couches du rĂ©seau resnet34 et pas seulement celles ajoutĂ©es Ă  la fin du modĂšle afin d’avoir une architecture capable de donner une probabilitĂ© pour chacune des 37 classes
 MAIS en utilisant des Learning Rate diffĂ©rents selon les couches via learn.fit_one_cycle(2, max_lr=slice(1e-6,1e-4)) : l’idĂ©e est que les premiĂšres couches n’ont pas besoin d’ĂȘtre beaucoup modifiĂ©es car elles ont Ă©tĂ© entraĂźnĂ©es Ă  dĂ©tecter des formes gĂ©omĂ©triques simples qui se retrouvent dans toutes images.

  • Etape 6 : on peut obtenir encore un meilleur rĂ©sultat (une erreur plus faible) en changeant de modĂšle et en utilisant un modĂšle plus compliquĂ© (plus profond) comme resnet50 (https://www.youtube.com/watch?v=7hX8yKCX6xM&t=9018)

12 Likes

Merci @pierreguillou.
Je vais me prĂ©senter aussi : Je bosse depuis 20 ans dans le dev, principalement sur des projets web en tant que chef de projet technique. En ce moment je suis freelance sur du big data et j’aimerais Ă©voluer vers des projets de Deep Learning. Le computer vision me passionne aussi mais il faut savoir que ce qui intĂ©resse majoritairement les entreprises c’est l’analyse de donnĂ©es structurĂ©es (base de donnĂ©es d’historique de ventes par exemple), puis le NLP et en dernier lieu les images.

@Mathieu : pas facile de conseiller une machine : il faut prendre le plus gros GPU que tu puisses t’offrir, mais ça pĂ©rime vite aussi alors une GTX 1070 n’est pas un mauvais choix car il y a quand mĂȘme 8Go. Pour la RAM assure toi de pouvoir ajouter 16Go si besoin plus tard car 32Go peuvent ĂȘtre bĂ©nĂ©fique pour le machine learning classique avec Pandas. Mais ça n’a rien d’obligatoire.
Personnellement j’ai une bĂȘte de course avec 32 cƓurs, 32Go de RAM, SSD NVME et GTX1080ti. Donc pas trop dans le budget d’un Ă©tudiant

Vu le prix du matos acheter une machine correcte comme tu le proposes est un bon choix. Rien ne t’empĂȘche quand tu as trouvĂ© les bons paramĂštres en local de louer du cloud pour faire tourner ton modĂšle sur des machines plus grosses.

1 Like