{ "cells": [ { "cell_type": "markdown", "id": "90f22c1d", "metadata": {}, "source": [ "
\n", "Licence CC BY-NC-ND\n", "Valérie Roy\n", "
\n", "\n", "" ] }, { "cell_type": "markdown", "id": "23c00ef1", "metadata": {}, "source": [ "Vous avez découverts les tableaux `numpy.ndarray` dont nous vous redonnons quelques méthodes:" ] }, { "cell_type": "markdown", "id": "82433309", "metadata": {}, "source": [ "| les méthodes | ce qu'elles font |\n", "|--------------------------|--------------------------------------------------|\n", "| `np.ndarray.size` | le nombre d'éléments du tableau |\n", "| `np.ndarray.itemsize` | la taille en octet d'un élément |\n", "| `np.ndarray.nbytes` | la taille totale du tableau sous-jacent en octet |\n", "| `np.ndarray.shape` | la forme du tableau (tuple) |\n", "| `np.ndarray.ndim` | le nombre de dimensions du tableau |\n", "| `np.ndarray.dtype` | le type des éléments |" ] }, { "cell_type": "markdown", "id": "1fda98e3", "metadata": {}, "source": [ "Nous allons maintenant rapidement aborder le sujet de la mémoire sur laquelle les tableaux `numpy.ndarray` sont stockés." ] }, { "cell_type": "code", "execution_count": 1, "id": "e8ef2ded", "metadata": {}, "outputs": [], "source": [ "import numpy as np" ] }, { "cell_type": "markdown", "id": "52712f22", "metadata": {}, "source": [ "Un petit aparté vers ceux qui se demandent \n", "> à quoi cela peut bien me servir d'avoir une intuition de la manière dont la librarie `numpy` travaille en mémoire ?!\n", "\n", "Une première raison: afin que vous preniez des décisions en connaissance de cause ou du moins en essayant de comprendre les conséquences de vos choix.\n", "\n", "Une seconde raison: afin que vous ne soyez pas complètement dépourvus le jour où vos codes, en se complexifiant, deviendront beaucoup trop lents ou prendront trop d'espace mémoire pour traiter vos données ...\n", "\n", "Une troisième raison: afin de vous familiariser avec l'informatique et comprendre des mécanismes sous-jacents qui expliquent les choix des concepteurs de libraries.\n", "\n", "Une dernière raison, afin d'avoir une petite culture informatique technique bien formée pour ne jamais penser que c'est magique, incompréhensible ou trop compliqué ! \n", "Donc si vous ne comprenez pas bien une notion, vous le dites !\n", "et on vous l'explique" ] }, { "cell_type": "code", "execution_count": 2, "id": "5d6b741b", "metadata": {}, "outputs": [ { "data": { "text/html": [ "" ], "text/plain": [ "" ] }, "execution_count": 2, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# une cellule pour définir le style de présentation \n", "# utilisé dans la suite pour les dessins de la mémoire\n", "\n", "my_stylesheet = \"\"\n", "\n", "from IPython.display import HTML\n", "HTML(my_stylesheet)" ] }, { "cell_type": "markdown", "id": "a218e1f3", "metadata": {}, "source": [ "# numpy et la mémoire" ] }, { "cell_type": "markdown", "id": "03cf05d6", "metadata": {}, "source": [ "Reprenons notre matrice du notebook précédent:" ] }, { "cell_type": "code", "execution_count": 3, "id": "5a183bb3", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1, 2, 3, 4, 5],\n", " [ 6, 7, 8, 9, 10],\n", " [11, 12, 13, 14, 15],\n", " [16, 17, 18, 19, 20]])" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "matrice = [\n", " [1, 2, 3, 4, 5], \n", " [6, 7, 8, 9, 10],\n", " [11, 12, 13, 14, 15],\n", " [16, 17, 18, 19, 20]\n", "]\n", "mat = np.array(matrice)\n", "mat" ] }, { "cell_type": "markdown", "id": "55697dda", "metadata": {}, "source": [ "Notre matrice contient 20 éléments:" ] }, { "cell_type": "code", "execution_count": 4, "id": "0772a882", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "20" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "mat.size" ] }, { "cell_type": "code", "execution_count": 5, "id": "ff395569", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "dtype('int64')" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "mat.dtype" ] }, { "cell_type": "markdown", "id": "1d05b2ca", "metadata": {}, "source": [ "Chaque élément est codé sur un `numpy.int64` et occupe donc 8 octets:" ] }, { "cell_type": "code", "execution_count": 6, "id": "5694071d", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "8" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "mat.itemsize" ] }, { "cell_type": "markdown", "id": "3f9c825b", "metadata": {}, "source": [ "Donc la mémoire qu'occupe la matrice en nombre d'octets est $20 \\times 8$:" ] }, { "cell_type": "code", "execution_count": 7, "id": "4be4d0e2", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "160" ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" } ], "source": [ "mat.nbytes # byte = otet" ] }, { "cell_type": "markdown", "id": "3ae98ab3", "metadata": {}, "source": [ "Nous allons maitenant nous intéresser à la manière dont est représentée cette mémoire dans l'ordinateur lorsque la matrice est créée." ] }, { "cell_type": "markdown", "id": "aa8dc0f9", "metadata": {}, "source": [ "## organisation de la mémoire des tableaux" ] }, { "cell_type": "markdown", "id": "299a3386", "metadata": {}, "source": [ "Lisons le help (en faisant ```help(np.ndarray)``` ou directement ```np.ndarray?``` dans un notebook), il vous dit que votre `np.ndarray` est un tableau:\n", " 1. **multidimensionnel**\n", " 1. **homogène**\n", " 1. d'éléments de **taille fixe**\n", " 1. et que les tableaux doivent être construits en utilisant les méthodes `np.array`,`np.zeros` ou `np.empty`" ] }, { "cell_type": "markdown", "id": "ff4f5200", "metadata": {}, "source": [ "Bon déjà que les tableaux soient **multidimensionnel**s ça nous rassure: ils sont là pour cela !" ] }, { "cell_type": "markdown", "id": "804d3fea", "metadata": {}, "source": [ "Qu'on les crée avec les méthodes `np.array`,`np.zeros` ou `np.empty`, on l'a vu." ] }, { "cell_type": "markdown", "id": "aff329c0", "metadata": { "tags": [ "level_basic" ] }, "source": [ "Mais que veut bien dire que les tableaux sont homogènes ? Une idée ? Dans les exemples que nous avons vus ?" ] }, { "cell_type": "markdown", "id": "6948a331", "metadata": {}, "source": [ "Vous avez commencé à vous en rendre compte avec les tableaux que nous avons construits. Ce qui est homogène c'est le type des éléments. Toutes les cases du tableau ayant le même type, elles occupent la même taille en mémoire." ] }, { "cell_type": "markdown", "id": "3c83f7de", "metadata": { "tags": [ "level_basic" ] }, "source": [ "Et que veut-dire que tous les éléments sont de **taille fixe** ?" ] }, { "cell_type": "markdown", "id": "b40559cd", "metadata": { "tags": [] }, "source": [ "Ca veut dire qu'une fois le tableau créé, vous n'allez pas pouvoir modifier la taille de ses éléments (la place sur laquelle chaque élément est stocké en mémoire). Si vous avez besoin de modifier la taille des éléments que contient un tableau, vous devez faire un nouveau tableau. On y revient bientôt." ] }, { "cell_type": "markdown", "id": "ecf4f1ec", "metadata": {}, "source": [ "A quoi servent toutes ces restrictions ?\n", "\n", "Vous avez là les ingrédients qui permettent à `numpy` d'être très rapide dans sa manipulation de tableaux !" ] }, { "cell_type": "markdown", "id": "ce56f615", "metadata": { "tags": [] }, "source": [ "### les secrets de la rapidité des tableaux `numpy` (avancé mais important)" ] }, { "cell_type": "markdown", "id": "aaae33e4", "metadata": { "tags": [ "level_basic" ] }, "source": [ "Quels sont les secrets d'un code rapide sur des tableaux ? Des idées ? C'est un peu difficile parce qu'on doit mettre (un peu) les mains dans le cambouis (ici la mémoire) et mais vous pouvez proposer des idées ! J'en vois déjà un:" ] }, { "cell_type": "markdown", "id": "188f0a2d", "metadata": {}, "source": [ "#### premier secret (*offset*)" ] }, { "cell_type": "markdown", "id": "53c7f0aa", "metadata": { "tags": [] }, "source": [ "C'est la possibilité quand on est sur un élément d'un tableau de passer très rapidement à un autre élément du même tableau.\n", "\n", "Comment fait-on cela ?" ] }, { "cell_type": "markdown", "id": "791d14e7", "metadata": { "tags": [] }, "source": [ "Et bien si toute la zone mémoire du tableau est composée d'un unique block mémoire continu \n", "(c-à-d si les cases du tableaux sont contiguës en mémoire) ... \n", "\n", "passer d'une case à une autre (d'un élément à un autre) se fait alors grâce à un simple décalage - appelé *offset*(\\*) \n", "et les ordis font ca super super vite !\n", "\n", "\n", "\n", "(\\*) Je plagie Wikipédia: *l'offset désigne une adresse de manière relative. C'est une valeur entière représentant le déplacement en mémoire nécessaire, par rapport à une adresse de référence, pour atteindre une autre adresse. Autrement dit, l'offset est la distance séparant deux emplacements mémoire.*" ] }, { "cell_type": "markdown", "id": "f86b2424", "metadata": { "tags": [] }, "source": [ "Voici des cases mémoire contiguës en mémoire qui forment un tableau.\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", "```\n", "
" ] }, { "cell_type": "markdown", "id": "5da6993f", "metadata": { "tags": [] }, "source": [ "Voici des cases mémoire un peu partout (pour tenter de décrire le type de fragmentation qu'on obtient quand on utilise des types de base de Python, comme par exemple une liste de listes)\n", "\n", "
\n", "\n", "```\n", "...☐.......☐..☐....☐... \n", "☐....☐.....☐.....☐..... \n", "..☐...☐.....☐......☐... \n", "☐.....☐.......☐...☐....\n", "```\n", "\n", "
" ] }, { "cell_type": "markdown", "id": "0ac5c762", "metadata": { "tags": [] }, "source": [ "L'ordi va se déplacer beaucoup plus rapidement pour passer d'un élément à un autre \n", "si les éléments sont continuës \n", "que si les éléments du tableau sont dissiminés un peu partout dans la mémoire \n", "(comme c'est le cas dans certaine stuctures de données, par exemple les listes chaînées)." ] }, { "cell_type": "markdown", "id": "7777d530", "metadata": {}, "source": [ "Et pour cela il faut que la taille des éléments du tableau soit fixe." ] }, { "cell_type": "markdown", "id": "f50b44c5", "metadata": {}, "source": [ "#### second secret (*pas d'indirection*)" ] }, { "cell_type": "markdown", "id": "0bc11164", "metadata": {}, "source": [ "Un second secret, c'est que `numpy` quand il arrive dans une case du tableau: il y trouve la valeur qu'il cherche \n", "(on parle là de nos exemples avec des nombres)." ] }, { "cell_type": "markdown", "id": "5d3f9760", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "Quelques mots sur les listes Python pour ceux qui sont avancés:\n", "\n", "Les listes Python sont en fait codées sous la forme de tableaux (i) qui peuvent changer de taille, (ii) dont les éléments sont de type hétérogène, (ii) où vous pouvez modifier ou rajouter un élément de n'importe quel type sans que les autres éléments ne soient touchés...\n", "\n", "En informatique, un tableau est une zone mémoire qui est continue en mémoire, toujours. Voila un exemple de tableau de 3 cases:" ] }, { "cell_type": "code", "execution_count": 8, "id": "67bdbdca", "metadata": { "tags": [ "level_advanced" ] }, "outputs": [ { "data": { "text/plain": [ "[1, 12345678235234501256848345678901234567890264378034, 3.141592653589793]" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t3 = [ 1, True, np.pi]\n", "t3[1] = 12345678235234501256848345678901234567890264378034\n", "t3" ] }, { "cell_type": "markdown", "id": "79e8c19e", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "Donc, si les cases d'un tableau en informatique ont toujours la même taille, comment vais-je y \"*mettre*\" des élément hétérogènes ? Des idées ?" ] }, { "cell_type": "markdown", "id": "1a5918ee", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "Oui nous allons utiliser des adresses ! on va mettre dans la case, l'adresse de l'endroit où se trouve l'élément en mémoire.\n", "\n", "Toutes les adresses sont codées sur le même nombre d'octets. Combien ? J'espère 8 octets (64 bits) ! heu vous avez un ordi 32-bits ... c'est qui qui vous l'a prêté ?\n", "\n", "Quand on arrive sur un élément et qu'on *trouve* sur une adresse, pour y aller lire la valeur, nous n'avons pas un simple offset à faire mais bien une indirection et c'est beaucoup beaucoup plus long..." ] }, { "cell_type": "markdown", "id": "fbecd2e5", "metadata": {}, "source": [ "### taille fixe des éléments" ] }, { "cell_type": "markdown", "id": "ac95237e", "metadata": {}, "source": [ "Pour illustrer le fait que la taille des éléments est fixe dans un tableau `numpy`, vous allez faire un petit exercice: créer un tableau `numpy` de chaînes de caractères." ] }, { "cell_type": "markdown", "id": "19a79070", "metadata": {}, "source": [ "À vous de jouer. Voici une liste python des jours de la semaine. Construisez une `numpy.ndarray` avec cette liste.\n", "\n", "Affichez le type que `numpy` a choisi comme type pour les éléments. Rappelez-vous tous les éléments vont-être du même type ! Donc toutes les chaînes de caractères vont avoir le même type." ] }, { "cell_type": "code", "execution_count": 9, "id": "b7f57d5c", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "str" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "les_jours = ['lundi', 'mardi', 'mercredi', 'jeudi', 'vendredi', 'samedi', 'dimanche']\n", "type(les_jours[0])" ] }, { "cell_type": "code", "execution_count": 10, "id": "b26ff0b5", "metadata": {}, "outputs": [], "source": [ "# votre code ici (correction ci-dessous, ne pas regarder tout de suite !)" ] }, { "cell_type": "code", "execution_count": 11, "id": "a469cc92", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "dtype('\u001b[0;34m\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# solution\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 2\u001b[0;31m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0marray\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0ml\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mdtype\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfloat\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", "\u001b[0;31mValueError\u001b[0m: could not convert string to float: 'bonjour'" ] } ], "source": [ "# solution\n", "np.array(l, dtype=np.float)" ] }, { "cell_type": "markdown", "id": "b09b6366", "metadata": {}, "source": [ "Qu'avez-vous eu ? Oui une erreur `ValueError` lorsque `numpy` a essayé de convertir 'bonjour' en un entier ... bon il arrive à faire les conversions évidentes et là il n'en trouve pas !" ] }, { "cell_type": "markdown", "id": "8430cbb1", "metadata": {}, "source": [ "Il existe des types prédéfinis, regardez là: https://docs.scipy.org/doc/numpy/user/basics.types.html).\n", "\n", "Ce qu'il faut en retenir :\n", "\n", "* vous pouvez choisir entre `bool`, `int`, `uint` (entier non signé), `float` et `complex` ;\n", "* ces types ont diverses tailles pour vous permettre d'optimiser la mémoire utilisée ;\n", "* ces types existent en tant que tels (hors de tableaux)." ] }, { "cell_type": "markdown", "id": "2a765ff9", "metadata": {}, "source": [ "## organisation de la forme des tableaux" ] }, { "cell_type": "markdown", "id": "e329ff3c", "metadata": {}, "source": [ "Vous savez désormais que la mémoire qui stocke le tableau est un segment unidimensionnel continu de cases du même type, \n", "que la taille d'un tableau est fixe \n", "que la taille des éléments est fixe\n", "\n", "Revoici des cases mémoire contiguës en mémoire qui forment un tableau\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", "```\n", "\n", "
" ] }, { "cell_type": "markdown", "id": "0162b598", "metadata": {}, "source": [ "Vous avez aussi vu que cette mémoire va être organisée (*indexée*) pour lui donner la forme d'un tableau multi-dimensionnel. Pour l'instant on a vu des matrices donc des tableaux de forme $(d_1, d_2)$. Mais un tableau peut naturellement prendre n'importe quelle dimension.\n", "\n", "Prenons un tableau de dimension $(d_1, d_2, d_3, d_4)$. Le segment unidimensionnel continu fera donc $d_1 \\times d_2 \\times d_3 \\times d_4$ cases de long.\n", "\n", "Chaque case étant de la taille mémoire suffisante pour stocker le type demandé pour les éléments, par exemple 64 bits.\n", "\n", "Dans cette multi-indexation, les deux dernières dimensions sont les *lignes* et les *colonnes* d'une matrice. Dans notre exemple il s'agit de $(d_3, d_4)$. \n", "\n", "Ainsi ici $d_2$ serait un nombre de matrices. On a des paquets de $d_2$ matrices. Et $d_1$ serait le nombre de fois où on a ces paquets de matrices.\n", "\n", "Ici on aura $d_1$ paquets de $d_2$ matrices de $d_3$ lignes et $d_4$ colonnes.\n", "\n", "Ainsi prendre 2 matrices de 3 lignes et 4 colonnes ferait une dimension (2, 3, 4) et ainsi de suite..." ] }, { "cell_type": "markdown", "id": "b6525f4e", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "Pour les avancés, dans l'exemple de l'image en couleur, en encodage RGB, on voit que la dimension de l'image est (530, 800, 3).\n", "\n", "C'est à dire que l'image et présentée comme 530 matrices de 800 lignes et 3 colonnes et non pas 3 matrices de 533 lignes et 800 colonnes ! Comme on s'y attendait (peut être)\n", "\n", "Pourquoi ? Parce qu'en fait une image est plutôt vue comme une unique matrice où chaque élément (donc chaque pixel de l'image) a trois valeurs: une pour chacune des couleurs primaireset qu'il est préférable de rapprocher les 3 valeurs RGB de chaque pixel pour ne pas ralentir les calculs." ] }, { "cell_type": "markdown", "id": "62b93eb0", "metadata": {}, "source": [ "Maintenant créons un segment de, par exemple, 30 éléments. Et ne donnons pas de forme, juste la taille. On en profite pour réutiliser la fonction qui fait des tableaux de 1 (la bien-nommée `np.ones`, heu non y'a pas `np.twos` ... `np.threes`)." ] }, { "cell_type": "markdown", "id": "4b751b5b", "metadata": { "tags": [ "level_intermediate" ] }, "source": [ "Pour les avancés. Pourquoi avoir une fonction dédiée aux tableaux de 1 ?\n", "\n", "Parce que cela vous permet de créer très rapidement un tableau où tous les éléments ont la même valeur, il suffit de multiplier un tableau de 1 de la bonne forme par votre valeur, on y reviendra ... mais vous pouvez déjà essayer `np.ones(shape=(30,))*np.pi`, oh les 30 beaux $\\pi$ !" ] }, { "cell_type": "code", "execution_count": 25, "id": "72d31677", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,\n", " 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])" ] }, "execution_count": 25, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg = np.ones(shape=(30,)) # ou shape=30 et il comprend\n", "seg" ] }, { "cell_type": "markdown", "id": "19eb30af", "metadata": {}, "source": [ "Quel est le type des éléments ? Une idée ? En bien si vous n'indiquez pas le type des éléments à ce genre de fonctions (comme `np.zeros`, `np.empty`, `np.ones`), elles prennent par défaut le type flottants sur 64 bits. Nous le vérifions:" ] }, { "cell_type": "code", "execution_count": 26, "id": "01f89a09", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "dtype('float64')" ] }, "execution_count": 26, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.dtype" ] }, { "cell_type": "markdown", "id": "f8d21933", "metadata": {}, "source": [ "Donc nous voici avec un tableau dont la taille initiale est la suivante:" ] }, { "cell_type": "code", "execution_count": 27, "id": "4a3248d6", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(30,)" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.shape" ] }, { "cell_type": "markdown", "id": "c89a6b9e", "metadata": {}, "source": [ "Et dont la dimension est la suivante:" ] }, { "cell_type": "code", "execution_count": 28, "id": "d2e7a49f", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "1" ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.ndim" ] }, { "cell_type": "markdown", "id": "748ae601", "metadata": {}, "source": [ "Disons que cette forme est celle d'un vecteur *ligne*. Dans ce cas on n'a donc besoin que d'un seul index pour parcourir ce tableau (si on voulait le parcourir). On serait dans ce cas (où $o$ désigne l'offset par rapport au début de la mémoire du tableau; du coup bien sûr ici l'offset se confond avec l'indice)\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", " ↑\n", "```\n", "\n", "
\n", "\n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ vecteur de 30 élements : ${0\\leq i < 30} \\;\\;\\;\\;\\;\\; i = 15 \\longrightarrow o = 15$" ] }, { "cell_type": "markdown", "id": "b0762023", "metadata": {}, "source": [ "Et si nous voulions que ce tableau de 30 cases prenne une nouvelle forme: on ne veut plus le considérer comme un vecteur ligne mais comme, par exemple, une matrice avec 3 lignes et 10 colonnes ?\n", "\n", "On a bien le même nombre d'éléments (30) dans les deux formes, simplement dans la seconde forme, on est en dimension 2. C'est à dire qu'on aura besoin de deux indices (un pour les lignes et un pour les colonnes) pour parcourir notre matrice (si on voulait la parcourir). On serait dans ce cas:\n", "\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", "↑\n", "```\n", "\n", "
\n", "\n", "\n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ matrice 3 x 10 : ${0\\leq i < 3,\\ 0 \\leq j < 10} \\;\\;\\;\\;\\;\\; (i=0, j=0) \\longrightarrow o=0$" ] }, { "cell_type": "markdown", "id": "66937b73", "metadata": {}, "source": [ "Et bien `np.ndarray` comporte deux fonctions pour ré-indexer la mémoire unidimensionnelle sous-jacente. \n", "Ces fonctions sont `np.ndarray.reshape` et `np.ndarray.resize`." ] }, { "cell_type": "markdown", "id": "08511749", "metadata": {}, "source": [ "### réindexer un `ndarray.reshape` et `ndarray.resize`" ] }, { "cell_type": "markdown", "id": "5846cbfd", "metadata": {}, "source": [ "`np.ndarray.reshape` et `np.ndarray.resize` s'appliquent toutes les deux aux objets de type `np.ndarray` (ce sont des méthodes du type `np.ndarray`)." ] }, { "cell_type": "markdown", "id": "ac210be7", "metadata": { "tags": [ "level_basic" ] }, "source": [ "Quelle est leur différence ? Essayez de regarder leur help. Alors ? La voyez-vous ? Elle est petite..." ] }, { "cell_type": "markdown", "id": "e2936a8d", "metadata": {}, "source": [ "Le help de `np.ndarray.resize` vous dit \"*Change shape and size of array in-place*\".\n", "\n", "**in-place** signifie **dans l'objet** auquel la fonction est appliquée.\n", "\n", "Le help de `np.ndarray.reshape` vous dit \"*Returns an array containing the same data with a new shape.*\"\n", "\n", "Elle renvoie une nouvelle manière d'indexer votre tableau mais cette indexation travaille aussi (comme resize) sur la même mémoire sous-jacente.\n", "\n", "Leur similitude ? Aucune des deux ne crée de nouveau `np.ndarray`." ] }, { "cell_type": "markdown", "id": "f81ab679", "metadata": {}, "source": [ "Naturellement la taille du tableau initial doit correspondre à la taille du tableau re-structuré." ] }, { "cell_type": "markdown", "id": "36d3c929", "metadata": {}, "source": [ "#### exemple avec ` numpy.resize`" ] }, { "cell_type": "code", "execution_count": 29, "id": "5102f13f", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(30,)" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.shape" ] }, { "cell_type": "code", "execution_count": 30, "id": "aa2fc9b8", "metadata": {}, "outputs": [], "source": [ "seg.resize((3, 10)) # vous voyez que l'application de la fonction resize à seg ne renvoie rien et modifie seg" ] }, { "cell_type": "code", "execution_count": 31, "id": "543e756d", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(3, 10)" ] }, "execution_count": 31, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.shape" ] }, { "cell_type": "markdown", "id": "7af1358c", "metadata": {}, "source": [ "Ou plus simplement on l'affiche. On voit bien les 3 lignes de 10 éléments." ] }, { "cell_type": "code", "execution_count": 32, "id": "5012fff6", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],\n", " [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],\n", " [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])" ] }, "execution_count": 32, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg" ] }, { "cell_type": "markdown", "id": "1a0b5afb", "metadata": {}, "source": [ "#### exemple avec `numpy.reshape`" ] }, { "cell_type": "code", "execution_count": 33, "id": "ae7b58c0", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],\n", " [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],\n", " [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])" ] }, "execution_count": 33, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg = np.ones(shape=30).reshape(3, 10) # vous voyez que reshape renvoie \n", " # un nouvel objet avec une nouvelle forme\n", "seg" ] }, { "cell_type": "markdown", "id": "e14c214b", "metadata": {}, "source": [ "### index et décalages" ] }, { "cell_type": "markdown", "id": "89975948", "metadata": {}, "source": [ "Parlons un peu de ce qu'on a appelé précédemment décalages ou offsets pour les relier à notre problème de forme." ] }, { "cell_type": "markdown", "id": "4b9285a3", "metadata": {}, "source": [ "Illustrons l'offset $o$ qu'il faut utiliser pour accéder à une case d'une matrice 3 x 10\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", "↑\n", "```\n", "\n", "
\n", "\n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ matrice 3 x 10 : ${0\\leq i < 3,\\ 0 \\leq j < 10} \\;\\;\\;\\;\\;\\; (i=0, j=0) \\longrightarrow o=0$" ] }, { "cell_type": "markdown", "id": "fc3fd86d", "metadata": {}, "source": [ "Si je suis sur un élément en début d'une ligne, pour passer directement à l'élément en début de la ligne suivante, combien me faudra-t-il *sauter* d'éléments?\n", "\n", "i.e. de combien me faudra-t-il me décaler sur mon segment unidimensionnel sous-jacent ?\n", "\n", "Oui il faudra \"sauter\" 10 éléments et 10, on le connait ce chiffre ! c'est la valeur de la deuxième dimension de notre forme (le nombre de colonnes).\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", " ↑\n", "```\n", "\n", "
\n", "\n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ matrice 3 x 10 : ${0\\leq i < 3,\\ 0 \\leq j < 10} \\;\\;\\;\\;\\;\\; (i=i, j=0) \\longrightarrow o=10$" ] }, { "cell_type": "markdown", "id": "7bfb0e1f", "metadata": {}, "source": [ "Si je voulais passer de cet élément à celui situé 5 cases à sa droite, je dois simplement sauter 5 nouvelles cases\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", " ↑\n", "```\n", "\n", "
\n", " \n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ matrice 3 x 10 : ${0\\leq i < 3,\\ 0 \\leq j < 10} \\;\\;\\;\\;\\;\\; (i=1, j=5) \\longrightarrow o=15$" ] }, { "cell_type": "markdown", "id": "41167c53", "metadata": {}, "source": [ "Et donc la dernière colonne de la dernière ligne se trouve logiquement à la fin de la mémoire \n", "\n", "\n", "
\n", "\n", "```\n", "☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐☐\n", " ↑\n", "```\n", "\n", "
\n", "\n", "$\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;$ matrice 3 x 10 : ${0\\leq i < 3,\\ 0 \\leq j < 10} \\;\\;\\;\\;\\;\\; (i=2, j=9) \\longrightarrow o=29$" ] }, { "cell_type": "markdown", "id": "541f405d", "metadata": {}, "source": [ "Et bien sûr si de là j'essaie d'avancer encore (parce que je me suis trompé de formule, ou que j'ai utilisé un $i$ ou un $j$ trop grand), eh bien j'arrive en dehors de la mémoire qui m'a été attribuée et là c'est pas bon du tout du tout du tout du tout! \n", "Allez-vous vous attirer les foudres de l'ordi en essayant d'aller dans un segment (une zone mémoire) qui n'est pas à vous? \n", "... non heureusement `numpy` va vérifier avant d'y aller, que vous restez dans les bornes \n", "il vous indiquera que vous en sortez avec une erreur !" ] }, { "cell_type": "markdown", "id": "8e8654af", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "On voit que la formule qui donne l'offset à partir de $i$ et $j$ est\n", "\n", "$o = (10*i) + j\\;\\;\\;\\;\\;\\;\\;\\;\\;$ (*row-major* est le défaut avec `numpy`)\n", "\n", "\n", "En fait c'est vrai pour les tableaux qu'on appelle rangés dans l'ordre *row-major*, qui est le défaut en *numpy*; on peut lui demander de les ranger dans l'autre sens - qui s'appelle donc logiquement *column-major* - et dans ce cas la formule devient bien sûr\n", "\n", "$o = (3*j) + i\\;\\;\\;\\;\\;\\;\\;\\;\\;$ (*column-major*, en option à la construction du tableau)" ] }, { "cell_type": "markdown", "id": "f25f64ae", "metadata": {}, "source": [ "À vous de jouer: transformez votre `seg` en 2 matrices de 5 lignes et 3 colonnes:" ] }, { "cell_type": "code", "execution_count": 34, "id": "92bd75f0", "metadata": {}, "outputs": [], "source": [ "# votre code ici - la correction ci-dessous" ] }, { "cell_type": "code", "execution_count": 35, "id": "d8816c58", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.]],\n", "\n", " [[1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.],\n", " [1., 1., 1.]]])" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "seg.resize(2, 5, 3)\n", "seg" ] }, { "cell_type": "markdown", "id": "91e0ecc1", "metadata": {}, "source": [ "## on essaie de *changer* le type d'un tableau `numpy.ndarray.astype`" ] }, { "cell_type": "markdown", "id": "3ce13887", "metadata": {}, "source": [ "Comme vous l'avez compris, `np.ndarray` va toujours faire en sorte que \n", "i) tous les éléments d'un tableau aient le même type à la création du tableau et \n", "ii) que les éléments restent de ce type quoi qu'on leur fasse subir. \n", "Essayons:" ] }, { "cell_type": "markdown", "id": "800f863c", "metadata": { "tags": [] }, "source": [ "A vous de jouer. Faite un `numpy.ndarray` de 4 entiers `int` (vous êtes grands je vous laisse choisir les 4 entiers mais le tableau doit s'appeler `vec`). Modifier le premier élément par `numpy.pi` et affichez votre tableau." ] }, { "cell_type": "code", "execution_count": 36, "id": "02ee03be", "metadata": {}, "outputs": [], "source": [ "# votre code ici - une correction ci-dessous" ] }, { "cell_type": "code", "execution_count": 37, "id": "d8eb721a", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 45, 24, 346])" ] }, "execution_count": 37, "metadata": {}, "output_type": "execute_result" } ], "source": [ "vec = np.array([12, 45, 24, 346])\n", "vec[0] = np.pi\n", "vec" ] }, { "cell_type": "markdown", "id": "31d2d294", "metadata": {}, "source": [ "Bon ok $\\pi$ est devenu `3`.\n", "\n", "Mais alors comment pouvons-nous \"modifier\" le type des éléments d'un tableau ? \n", "Et bien: on ne peut pas (on vous dit) ... \n", "mais on va pouvoir créer un nouveau tableau avec la même forme mais dont les *case* (donc les éléments) seront du nouveau type et y recopier les éléments dedans ...\n", "\n", "Rassurez-vous il existe une fonction pour cela ! Elle s'appelle `np.ndarray.astype`. Voici un exemple où je fais un tableau de flottants que je convertis en un tableau de `int`:" ] }, { "cell_type": "code", "execution_count": 38, "id": "37537dcc", "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/tmp/ipykernel_1983/1863336411.py:2: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.\n", "Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations\n", " tab1.astype(np.int)\n" ] }, { "data": { "text/plain": [ "array([ -2, 8, 0, 1, -67])" ] }, "execution_count": 38, "metadata": {}, "output_type": "execute_result" } ], "source": [ "tab1 = np.array([-2.7, 8.45, -0.89, 1.56, -67])\n", "tab1.astype(np.int)" ] }, { "cell_type": "markdown", "id": "98831b2f", "metadata": {}, "source": [ "Vous remarquez que la fonction `astype` renvoie bien un `numpy.ndarray`. On affiche `tab1`:" ] }, { "cell_type": "code", "execution_count": 39, "id": "3f1c7e10", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ -2.7 , 8.45, -0.89, 1.56, -67. ])" ] }, "execution_count": 39, "metadata": {}, "output_type": "execute_result" } ], "source": [ "tab1" ] }, { "cell_type": "markdown", "id": "3354f364", "metadata": {}, "source": [ "On remarque que `tab1` n'a pas été modifié ! on s'y attendait: la taille des éléments est fixe. Donc `astype` construit bien un nouveau tableau qu'on aurait pu garder dans une variable par exemple `tab2`" ] }, { "cell_type": "markdown", "id": "cd163150", "metadata": {}, "source": [ "On remarque aussi que les flottants, pour devenir des entiers, ont été modifiés fortement. On a perdu de l'information cette conversion est appelée *unsafe* i.e. *non sûre*." ] }, { "cell_type": "markdown", "id": "dceba575", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "C'est peut être ce que vous vouliez.\n", "\n", "Mais au cas où vous voulez éviter ce genre de conversions peu sûre (unsafe casting - parlons jargon) ... la fonction possède un paramètre qui interdit la création du nouveau tableau si la conversion n'est pas sûre (*safe*): \n", "\n", "Oui cela va se faire par la génération d'une erreur (laquelle ? comme on parle de *type* ca sera une `TypeError`). `numpy` va prévenir de cette tentative de conversion interdite lancant une exception qu'on doit rattraper sous menace que le programme *plante*" ] }, { "cell_type": "code", "execution_count": 40, "id": "0c7cc362", "metadata": { "tags": [ "level_advanced" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "pas content ! \n" ] }, { "name": "stderr", "output_type": "stream", "text": [ "/tmp/ipykernel_1983/267750065.py:2: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.\n", "Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations\n", " tab1.astype(np.int, casting='safe')\n" ] } ], "source": [ "try:\n", " tab1.astype(np.int, casting='safe')\n", "except TypeError as e:\n", " print(\"pas content ! \")" ] }, { "cell_type": "markdown", "id": "2f7c4baf", "metadata": {}, "source": [ "À vous de jouer. Prenez votre tableau `vec` d'entiers. \n", "Transformez-le en tableau de flottants \n", "mettez $\\pi$ dans la première case." ] }, { "cell_type": "code", "execution_count": 41, "id": "b272bc51", "metadata": { "tags": [ "raises-exception" ] }, "outputs": [], "source": [ "# votre code ici - correction ci-dessous" ] }, { "cell_type": "code", "execution_count": 42, "id": "80c31eab", "metadata": { "tags": [ "raises-exception" ] }, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/tmp/ipykernel_1983/2082349502.py:1: DeprecationWarning: `np.float` is a deprecated alias for the builtin `float`. To silence this warning, use `float` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.float64` here.\n", "Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations\n", " vec = vec.astype(np.float)\n" ] }, { "data": { "text/plain": [ "array([ 3.14159265, 45. , 24. , 346. ])" ] }, "execution_count": 42, "metadata": {}, "output_type": "execute_result" } ], "source": [ "vec = vec.astype(np.float)\n", "vec[0] = np.pi\n", "vec" ] }, { "cell_type": "code", "execution_count": null, "id": "0f8080e3", "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "markdown", "id": "8736864e", "metadata": {}, "source": [ "Maintenant que nous avons parlé de mémoire et que ca n'a pas été si facile que cela, détendons-nous avec de nouvelles super fonctions pour initialiser des tableaux..." ] }, { "cell_type": "markdown", "id": "beb731db", "metadata": {}, "source": [ "## tableaux de valeurs régulièrement espacées" ] }, { "cell_type": "markdown", "id": "89643ee9", "metadata": {}, "source": [ "Afin de simplifier les codes, `numpy` fournit des fonctions qui vont générer des points espacés régulièrement sur un intervalle que nous spécifions. \n", "On pourra ensuite appliquer des fonctions à ces points.\n", "\n", "Il existe pour cela deux fonctions: `np.arange` et `np.linspace`. \n", "Pour `arange` vous indiquez l'incrément entre deux valeurs successives (le pas ou `step`) et \n", "pour `linspace` vous donnez le nombre de points." ] }, { "cell_type": "markdown", "id": "d03f54ec", "metadata": {}, "source": [ "### la fonction `np.arange`" ] }, { "cell_type": "markdown", "id": "f7ad003c", "metadata": {}, "source": [ "La fonction `np.arange(from-included, to-excluded, step)` renvoie des nombres distants de la valeur `step` sur l'intervalle spécifié dans lequel seule la borne inférieure est incluse.\n", "\n", "Le help vous dit de ne **pas** utiliser un **incrément non entier** (comme 0.1), le résultat peut être non consistent, préférez pour cela `np.linspace`." ] }, { "cell_type": "code", "execution_count": 43, "id": "e6f448ae", "metadata": {}, "outputs": [], "source": [ "#np.arange?" ] }, { "cell_type": "code", "execution_count": 44, "id": "a7b806c6", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([0, 2, 4, 6, 8])" ] }, "execution_count": 44, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(0, 10, 2)" ] }, { "cell_type": "markdown", "id": "af292045", "metadata": {}, "source": [ "Par défaut le premier point sera 0 et l'incrément 1" ] }, { "cell_type": "code", "execution_count": 45, "id": "e704b85a", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])" ] }, "execution_count": 45, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(10)" ] }, { "cell_type": "markdown", "id": "1b915333", "metadata": {}, "source": [ "On peut bien sûr aller dans l'autre sens." ] }, { "cell_type": "code", "execution_count": 46, "id": "bbeb5b66", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([10, 9, 8, 7, 6, 5, 4, 3, 2, 1])" ] }, "execution_count": 46, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(10, 0, -1)" ] }, { "cell_type": "markdown", "id": "a9b78191", "metadata": {}, "source": [ "Les bornes peuvent être des nombre réels." ] }, { "cell_type": "code", "execution_count": 47, "id": "4bb6017b", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 0.2, 2.2, 4.2, 6.2, 8.2, 10.2])" ] }, "execution_count": 47, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(0.2, 10.3, 2)" ] }, { "cell_type": "markdown", "id": "c16e9505", "metadata": {}, "source": [ "On peut préciser les arguments positionnels `start`, `stop` et `step`:" ] }, { "cell_type": "code", "execution_count": 48, "id": "3ca32558", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1, 2, 3, 4, 5, 6, 7, 8, 9])" ] }, "execution_count": 48, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(start=1, stop=10, step=1) # attention stop n'est pas inclus" ] }, { "cell_type": "code", "execution_count": 49, "id": "5d5554eb", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 0, -1, -2, -3, -4, -5, -6, -7, -8, -9])" ] }, "execution_count": 49, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(start=1, stop=-10, step=-1) # stop n'est toujours pas inclus" ] }, { "cell_type": "markdown", "id": "1bbbbce4", "metadata": {}, "source": [ "Et si c'est *absurde* il va vous donner un tableau vide, c'est une bonne idée:" ] }, { "cell_type": "code", "execution_count": 50, "id": "a91a0112", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([], dtype=int64)" ] }, "execution_count": 50, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(start=1, stop=-10)" ] }, { "cell_type": "markdown", "id": "d9de8fbf", "metadata": { "tags": [ "level_advanced" ] }, "source": [ "Pour les avancés et les très curieux, oui parfois `np.arange` peut vous retourner des tableaux bizarrement initialisés lorsque vous lui préciser des arguments positionnels ... essayez donc de ne lui passer uniquement `start=10` ... ah oui bizarre n'est-il pas ?\n", "\n", "la raison ? demandez donc à stackoverflow (actuellement les meilleurs en réponses sur les problèmes de code tout langage - bon ils parlent anglais et oui il va falloir vous y faire de mener vos recherches sur l'informatique sur Internet en anglais)" ] }, { "cell_type": "markdown", "id": "15d8a37e", "metadata": {}, "source": [ "### la fonction `np.linspace`" ] }, { "cell_type": "markdown", "id": "2f8ef2df", "metadata": {}, "source": [ "La fonction `np.linspace(from-included, to-included, number)` crée des valeurs flottantes régulièrement espacées dans un intervalle. \n", "Vous lui fournissez l'intervalle (les **deux** extrémités seront incluses dans le tableau) et le nombre de points: `numpy` nous crée un `np.ndarray` avec les bonnes valeurs et le bon type.\n", "\n", "Notons la différence avec le `np.arange` dont la valeur supérieure de l'intervalle n'est pas incluse dans le tableau." ] }, { "cell_type": "markdown", "id": "41a43984", "metadata": {}, "source": [ "Voyons la fonction `np.linspace`. On va créer un tableau qui part de $-\\pi$, va jusqu'à $\\pi$ et comporte 30 points." ] }, { "cell_type": "code", "execution_count": 51, "id": "fb670578", "metadata": {}, "outputs": [], "source": [ "x = np.linspace(-np.pi, np.pi, 30)" ] }, { "cell_type": "code", "execution_count": 52, "id": "fed15e95", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([-3.14159265, -2.92493109, -2.70826953, -2.49160797, -2.2749464 ,\n", " -2.05828484, -1.84162328, -1.62496172, -1.40830016, -1.19163859,\n", " -0.97497703, -0.75831547, -0.54165391, -0.32499234, -0.10833078,\n", " 0.10833078, 0.32499234, 0.54165391, 0.75831547, 0.97497703,\n", " 1.19163859, 1.40830016, 1.62496172, 1.84162328, 2.05828484,\n", " 2.2749464 , 2.49160797, 2.70826953, 2.92493109, 3.14159265])" ] }, "execution_count": 52, "metadata": {}, "output_type": "execute_result" } ], "source": [ "x" ] }, { "cell_type": "code", "execution_count": 53, "id": "142f1ba3", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(30,)" ] }, "execution_count": 53, "metadata": {}, "output_type": "execute_result" } ], "source": [ "x.shape" ] }, { "cell_type": "markdown", "id": "072555ab", "metadata": {}, "source": [ "On vérifie l'inclusion des deux bornes." ] }, { "cell_type": "code", "execution_count": 54, "id": "bf114b9b", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(-3.141592653589793, 3.141592653589793)" ] }, "execution_count": 54, "metadata": {}, "output_type": "execute_result" } ], "source": [ "x[0], x[-1]" ] }, { "cell_type": "markdown", "id": "2c988304", "metadata": {}, "source": [ "Quel est le type de ses éléments ?" ] }, { "cell_type": "code", "execution_count": 55, "id": "c3a6ca51", "metadata": {}, "outputs": [], "source": [ "# votre code ici" ] }, { "cell_type": "code", "execution_count": 56, "id": "9a9009a5", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "dtype('float64')" ] }, "execution_count": 56, "metadata": {}, "output_type": "execute_result" } ], "source": [ "x.dtype # oui un flottant" ] }, { "cell_type": "markdown", "id": "e87a094d", "metadata": {}, "source": [ "A quoi cela peut-il bien servir ? Voyons rapidement un exemple, calculons et affichons un beau sinus entre $0$ et $2\\pi$." ] }, { "cell_type": "code", "execution_count": 57, "id": "59f79459", "metadata": {}, "outputs": [], "source": [ "import matplotlib.pyplot as plt # une librarie graphique (on la verra)\n", "# on demande ensuite à ce que les dessins soient inclus dans le notebook\n", "%matplotlib inline" ] }, { "cell_type": "code", "execution_count": 58, "id": "883d1dc8", "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "filenames": { "image/png": "/home/runner/work/python-numerique/python-numerique/notebooks/_build/jupyter_execute/2-02-numpy-type-memory_164_0.png" }, "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "x = np.linspace(0, 2*np.pi, 100)\n", "plt.plot(np.sin(x));\n", "# oh regardez comment on applique la fonction np.sin à tout x d'un coup !\n", "# (on y reviendra bien sûr)" ] }, { "cell_type": "markdown", "id": "0f0361e3", "metadata": {}, "source": [ "## tableau de valeurs aléatoires" ] }, { "cell_type": "markdown", "id": "807cc4b7", "metadata": {}, "source": [ "### entières `numpy.random.randint`" ] }, { "cell_type": "markdown", "id": "926a4567", "metadata": {}, "source": [ "Cette fonction va retourner un nombre entier tiré aléatoirement entre deux bornes (la seconde est exclue)." ] }, { "cell_type": "code", "execution_count": 59, "id": "fdf0490e", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "8" ] }, "execution_count": 59, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randint(0, 10)" ] }, { "cell_type": "markdown", "id": "aeb93204", "metadata": {}, "source": [ "Si vous ne spécifiez qu'une borne les entiers seront générés entre 0 et la borne." ] }, { "cell_type": "code", "execution_count": 60, "id": "848208c2", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "5" ] }, "execution_count": 60, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randint(10)" ] }, { "cell_type": "markdown", "id": "e921a078", "metadata": {}, "source": [ "Pour générer plusieurs valeurs, vous pouvez donner une forme qui s'appelle `size` (et **pas** `shape`)." ] }, { "cell_type": "code", "execution_count": 61, "id": "899b2c5b", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[[6, 2],\n", " [4, 4]],\n", "\n", " [[4, 5],\n", " [0, 6]],\n", "\n", " [[3, 5],\n", " [8, 4]]],\n", "\n", "\n", " [[[7, 7],\n", " [8, 6]],\n", "\n", " [[3, 7],\n", " [3, 8]],\n", "\n", " [[9, 9],\n", " [8, 8]]]])" ] }, "execution_count": 61, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randint(10, size=(2, 3, 2, 2))" ] }, { "cell_type": "markdown", "id": "513e3823", "metadata": {}, "source": [ "### flottantes `numpy.random.randn`" ] }, { "cell_type": "markdown", "id": "d02007c5", "metadata": {}, "source": [ "renvoie des échantillons de la loi normale univariée de moyenne 0 et de variance 1\n", "\n", "par défault un seul float est retourné:" ] }, { "cell_type": "code", "execution_count": 62, "id": "e8fc9e3a", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "1.2611376515399482" ] }, "execution_count": 62, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randn()" ] }, { "cell_type": "markdown", "id": "e7427d87", "metadata": {}, "source": [ "vous pouvez préciser la forme de la sortie:" ] }, { "cell_type": "code", "execution_count": 63, "id": "f810a2ec", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[-0.03083574, -0.46443379, 0.39774771, 0.95731045],\n", " [-0.30012956, 2.07613456, 1.55074582, -1.12273764],\n", " [-0.82855418, -0.11600405, -1.00999535, -0.7086178 ]],\n", "\n", " [[ 0.50980823, 0.61168367, 1.03546102, -1.19042325],\n", " [-1.04133034, 0.57514483, 0.20459938, -0.04532982],\n", " [-1.0093745 , -1.86908396, -1.14782834, 0.29094059]]])" ] }, "execution_count": 63, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randn(2, 3, 4)" ] }, { "cell_type": "markdown", "id": "aedad88b", "metadata": {}, "source": [ "À repousser plutôt en fin de séance sur `numpy`" ] }, { "cell_type": "markdown", "id": "47c31251", "metadata": {}, "source": [ "## quiz" ] }, { "cell_type": "markdown", "id": "026c40ef", "metadata": {}, "source": [ "considérons le tableau `np.array([[1, 2, 3], [ 4, 5, 6]])`\n", " - quel est le type de ses éléments (sur un ordi récent) ? `int8`, `int32` ou `int64`" ] }, { "cell_type": "markdown", "id": "c7bd412c", "metadata": {}, "source": [ "Qu'obtient-on si on fait:\n", " - `np.arange(1, 3)` ? `[1, 2, 3]` ou `[1, 2]` \n", " - `np.arange(1, 5, -1)` ? `[5, 4, 3, 2]` ou `[]` \n", " - `np.arange(3, 1, -1)` ? `[3, 2]` ou `[3, 2, 1]`" ] }, { "cell_type": "markdown", "id": "18dd6f74", "metadata": {}, "source": [ "Qu'obtient-on si on fait:\n", " - `np.linspace(1, 3, 3)` ? `[1., 2., 3.]` ou `[1, 2]`)\n", " - `np.linspace(1, 2, 5)` ? `[1., 1.25, 1.5, 1.75, 2.]` ou `[1., 1.2, 1.4, 1.6, 1.8, 2.]`" ] }, { "cell_type": "markdown", "id": "60dcd375", "metadata": {}, "source": [ "Que vaut `d` si on fait:\n", " - `d = np.array(['un', 'deux', 'trois'])`\n", " - `d[0] = 'quatre'`\n", " \n", "Est-ce `['quatre', 'deux', 'trois']` ? `oui` ou `non`" ] }, { "cell_type": "markdown", "id": "ad9294f5", "metadata": {}, "source": [ "Qu'est-ce la méthode `itemsize` d'un `np.ndarray` ?\n", " - `le nombre d'éléments` ou `la taille du tableau` ou `la taille d'un élément`" ] }, { "cell_type": "markdown", "id": "97a66cfb", "metadata": {}, "source": [ "## Exercices" ] }, { "cell_type": "markdown", "id": "5bbeb1c4", "metadata": {}, "source": [ "### comparaison des tailles mémoire d'une liste Python et d'un `ndarray`" ] }, { "cell_type": "markdown", "id": "6dced588", "metadata": {}, "source": [ "Utiliser la fonction `getsizeof` de la librarie `sys` de Python pour afficher la taille d'une liste Python de 1.000 entiers initialisés de 0 à 999 et d'un ndarray de la même série de nombres." ] }, { "cell_type": "code", "execution_count": 64, "id": "32b6f5e4", "metadata": {}, "outputs": [], "source": [ "# votre code ici" ] }, { "cell_type": "code", "execution_count": 65, "id": "5020317f", "metadata": {}, "outputs": [], "source": [ "# votre code ici" ] }, { "cell_type": "markdown", "id": "2b23e7f6", "metadata": {}, "source": [ "Que constatez-vous ?" ] }, { "cell_type": "markdown", "id": "f2a77e90", "metadata": {}, "source": [ "### génération aléatoire avec affichage couleur" ] }, { "cell_type": "markdown", "id": "49123977", "metadata": {}, "source": [ "Utilisez la fonction `numpy.random.randint(min, max, size, dtype)` pour construire une toute petite image de taille 10 pixels de côtés, en format RBG (i.e. où chaque pixel aura 3 valeurs) , que vous initialisez avec des entiers générés aléatoirement entre 0 et 255-inclus\n", "\n", "\n", "un `TypeError: Invalid shape (d0, d1, d2) for image data` vous signalera que vous avez donné une mauvaise `shape` à votre image.\n", "\n", "Quel est le plus petit type entier qui contient tous ces nombres ?" ] }, { "cell_type": "code", "execution_count": 66, "id": "b543984c", "metadata": {}, "outputs": [], "source": [ "import matplotlib.pyplot as plt\n", "%matplotlib inline\n", "import numpy as np # au cas où vous commencez par cet exercice on importe numpy sinon ca ne fait rien" ] }, { "cell_type": "markdown", "id": "c8135b18", "metadata": {}, "source": [ "Avec la fonction `plt.imshow` afficher l'image !\n", "\n", "Vous allez obtenir, une image un peu comme celle-là (Que c'est joli !)\n", "\n", "" ] }, { "cell_type": "code", "execution_count": 67, "id": "9a67e9f1", "metadata": { "hide_input": false }, "outputs": [], "source": [ "# votre code ici" ] } ], "metadata": { "jupytext": { "cell_metadata_filter": "all, -hidden, -heading_collapsed, -run_control, -trusted", "notebook_metadata_filter": "all, -jupytext.text_representation.jupytext_version, -jupytext.text_representation.format_version, -language_info.version, -language_info.codemirror_mode.version, -language_info.codemirror_mode, -language_info.file_extension, -language_info.mimetype, -toc", "text_representation": { "extension": ".md", "format_name": "myst" } }, "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.9.5" }, "notebookname": "les types en numpy", "source_map": [ 18, 27, 31, 42, 46, 48, 63, 71, 75, 79, 88, 92, 96, 98, 102, 104, 108, 110, 114, 118, 126, 130, 134, 138, 142, 146, 150, 156, 160, 164, 168, 174, 186, 197, 212, 219, 223, 227, 232, 240, 248, 252, 260, 264, 268, 274, 279, 283, 286, 290, 297, 303, 309, 313, 317, 321, 327, 331, 338, 342, 346, 348, 354, 358, 362, 366, 371, 375, 379, 383, 387, 393, 397, 403, 407, 417, 421, 437, 453, 461, 465, 471, 474, 478, 480, 484, 486, 490, 492, 507, 526, 531, 535, 539, 543, 555, 559, 563, 567, 571, 573, 577, 579, 583, 587, 591, 595, 609, 628, 643, 659, 666, 677, 681, 685, 688, 692, 699, 703, 707, 711, 721, 724, 728, 730, 734, 738, 746, 753, 759, 765, 773, 775, 779, 783, 792, 796, 802, 806, 808, 812, 814, 818, 820, 824, 826, 830, 834, 836, 840, 844, 850, 854, 861, 865, 869, 873, 875, 879, 881, 885, 889, 891, 895, 901, 906, 910, 914, 918, 920, 924, 926, 930, 932, 936, 942, 944, 948, 950, 954, 958, 963, 970, 976, 984, 989, 993, 997, 1001, 1005, 1007, 1011, 1015, 1024, 1028, 1036 ] }, "nbformat": 4, "nbformat_minor": 5 }