Jackv, il m'est venu une idée pour ton problème ((maintenant que tu m'as fourni des données plus précises), mais sachant que les meilleures estimations pour un N donné auront une probabilité très inférieure à 1%
Il est certain qu'aun départ, je voulais des probabilités au moins égales à 90% mais pour ton problème, c'est impossible compte tenu des données que tu as...
En reprenant les idées de tout le monde, il s'agit d'établir un nuage de point à partir des 3 données (P,T et k) que tu as actuellement et des probabilités d'obtenir ces données avec tes données pour chaque N
Tu as ta liste des 1750 solutions différentes environ. Tu as ta liste L2 de 105 (liste de ceux apparaissant 2 fois au moins) et k le nombre total de solutions qu'on t'a fourni (apparaissant au moins une fois donc).
Pour chaque N (N étant le nombre total de solutions différentes) à partir de N=L1 jusqu'à où on veut, on établit la probabilité p que ce N a d'avoir tes données. On peut établir ces probabilité. Il s'agit de loi de probabilité (à définir quelle loi ici...)...
Par exemple, pour N=1750, on regarde, sur les 1900 tirages, l'ensembles des répartitions possibles (Les 1750 différents tirés une fois et tous les autres cas pour les 2nd voire plus tirages, ou 1749 tirés différents avec le reste en doublés etc...). On voit déjà qu'ici le nombre de cas à traiter (pour N=1750) est très grand.
Après, on peut se répartir les tâches pour chaque N et se donner un nombre limite de cas de N à traiter (exemple N=20) donc de N=1750 à N=1770.
On obtiendra donc un graphique de p en fonction de N avec tes données actuelles. J'espère que les p ne seront pas trop petit pour pouvoir établir ce graphique.
Si le graphique obtenu visuellement semble être une fonction continue (et donc dérivable), si cette fonction a une dérivée qui sur, 0,..,+infini ne change au plus, qu'une fois de signe, en commençant par les positifs puis les négatifs donc... on obtiendra, un N maximum pour cette fonction qui sera le N qui se rapprochera le plus de ton cas de figure actuel.
La fonction f(t) pourra être déterminé par plusieurs méthodes:
- Méthode des moindres carrés
- Méthode de l'interpolation par polynome de Lagrange, auquel cas, on verra si on peut avoir une série entière par exemple.
Voilà donc ce qui est possible de faire en estimation mais comme je l'ai dit plus haut, la probabilité pour que le "meilleur" N trouvé soit celui de la solution à ton problème est très faible! (largement moins de 1%), donc... essayer de chercher une estimation de N par ces données est pure perte de temps (A mon humble avis)., puisqu'il suffit qu'il y ait un tirage supplémentaire pour complètement changer la donne.
Donc si tu veux avoir une bonne estimation, je pense que la méthode donnée initialement me parait la plus abordable statistiquement parlant (et en plus tu aura une estimation très bonne).