Yurii Nesterov UCL |
Complexity bounds for primal-dual methods minimizing the model of objective function We provide Frank-Wolfe (Conditional Gradients) method with a convergence analysis allowing to approach a primal-dual solution of convex optimization problem with composite objective function. Additional properties of complementary part of the objective (strong convexity) significantly accelerate the scheme. We also justify a new variant of this method, which can be seen as a trust-region scheme applying the linear model of objective function. Our analysis works also for a quadratic model, allowing to justify the global rate of convergence for a new second-order method. To the best of our knowledge, this is the first trust-region scheme supported by the worst-case complexity bound. |
Léon Bottou |
Quels signaux pour l’apprentissage non-supervisé ? Nos machines peuvent apprendre à reconnaître des objets dans des images, mais en utilisant avec plus d’images qu’un humain ne voit pendant sa vie entière. Nos machines peuvent apprendre à jouer avec une console Atari, mais seulement après avoir joué plus de parties qu’une classe d’ados. Nos machines peuvent apprendre à jouer au Go au niveau des meilleurs humains, mais seulement après avoir joué plus de parties à ce niveau que l’humanité entière. Pourquoi de telles inefficacités ? Nous pouvons accuser les algorithmes d’apprentissage, mais nous pouvons aussi supposer que cela se produit parce que nous n’exploitons qu’une toute petite partie du signal présent dans les données. La première partie de cette présentation montre comment les moments d’ordre élevés contiennent des informations causales. En particulier, nous montrons que la distribution d’une collection d’images contient des informations sur les relations causales entre les objets que ces images représentent. La seconde partie compare les distances que l’on peut utiliser pour révéler ces aspects des distributions de probabilité. Cette analyse nous permet de construire de meilleurs algorithmes pour l’apprentissage des « Generative Adversarial Networks (GANs) |
Yves Grandvalet CNRS |
Évolution de l'apprentissage automatique et de sa perception : quel impact pour notre communauté scientifique ? |