[HELP] Stats et échantillon représentatif

Hello tout le monde,

Parlons un peu stat, proba, échantillon représentatif, intervalle de confiance…

Enfin non, n’en parlons pas directement car je ne souhaite pas exposer ma demande de façon publique pour diverses raisons.

Je précise tout d’abord qu’il ne s’agit pas ici de poker, même si certaines notions dont j’ai besoin se retrouvent dans notre jeu favori.

Je cherche quelqu’un qui pourrait m’aider à faire quelques calculs liés aux notions évoquées ci-dessous. J’ai essayé de me replonger dans mes vieux cours de lycée, quasi certain que je pourrais y trouver mes réponses. Mais honnêtement, la tâche est fastidieuse et j’ai vraiment pas beaucoup de temps devant moi et pas le droit de me planter.

Pour donner un petit aperçu, je vais tenter de schématiser en deux trois phrases ce que je recherche afin que vous puissiez savoir si ma demande entre dans votre domaine de compétence : imaginons un ouvrier qui a une tâche quotidienne très répétitive. En l’occurrence, il répare des téléphones portables dans une usine bien planquée Il l’accomplit des dizaines, voire centaines de fois chaque jour. Le résultat de certaines de ses tâches est ensuite évalué, de façon binaire (conforme ou non conforme aux attentes). L’idée en gros est de savoir si :

  • Le % de taches évaluées a une importance pour savoir si l’évaluation tient la route et reflète bien le travail de l’ouvrier. (ou est-ce seulement le nombre de tâches évaluées qui a une influence)
  • L’échantillon de taches évaluées a besoin d’être plus grand pour être représentatif si l’objectif est plus élevé (je vois pas comment il pourrait en être autrement)

Et deux trois ptits trucs concrets liés à ses questions.

Je pense très sincèrement que la ou les bonnes ames qui accepteront de m’aider auront vraiment besoin de très peu de temps à me consacrer pour m’aider efficacement.

J’en appelle donc à vous, votre aide pourrait m’être très précieuse. PLEASE MP ME si vous avez 10 minutes à m’accorder !

D’avance, UN GRAND MERCI !

plop

mauvais exemple !

tu parles stats mais sans nous donner le degré de complexité de sa tâche, hardiesse de celle ci etc…

entre trouver x% sur un échantillon dans une tache, genre je remplace la batterie je connecte 2 fils et trouver y% sur ce même échantillon dans une tache requérant des compétences pointues, une manipulation précise etc… on est pas du tout dans le même domaine.

tu dis des centaines de taches chaque jour, là encore, intègre t’on un “facteur” de durée/tronçon d’intervalle ? si la tache est basique, le fait qu’il fatigue au 487e tél a peu d’impact, par contre si c’est une tache complexe, fatalement il y a un accroissement potentiel de boulettes sur les dernières heures quotidiennes.

ps : si c’est pour jauger le travail de quelqu’un dans les faits et te trouver un algo qui permette de lourder les gens les moins performant, clairement je passe la main.

donc, si j’ai pas plus d’infos sur le pourquoi de la demande, désolé mais non, je n’apporterais pas mon aide pour une entreprise qui me semble pouvoir toucher à l’être humain et à son bien être. je suis ni Zorro ni le syndicaliste masqué mais j’aime savoir à quoi j’apporte ma contribution.

good luck pour ta recherche.

ps : 2ème posts pour demander de l’aide sur un truc “obscur” => de facto tu m’enchantes pas (edit : en étant inscrit depuis près de 4ans… :whistle: :pinch: :blink: )

re good luck

°+°

Salut Yeepaa, et merci pour ta réponse !

Tout d’abord, pour remettre les choses dans leur contexte, l’exemple cité est entièrement fictif. J’ai juste essayé de trouver un parallèle pour éviter de devoir trop en dire sur ma personne.

Je comprends ton appréhension et vais donc tenter d’en dire un peu plus pour que mes intentions soient mieux comprises. Déjà, je ne suis pas l’employeur tyrannique que tu imagines, mais bien l’employé effectuant les dites tâches et se sentant lésé.

Concrètement, je me suis fait évaluer pour mon taf et j’ai l’impression que l’évaluation est vraiment trop légère pour être représentative.

Le facteur temps ou la complexité pour chaque tache n’est pas pris en compte. On jugera ici uniquement la qualité du travail, à savoir “conforme aux attentes” ou “non conforme aux attentes”. On considèrera que les taches sont toutes parfaitement identiques.

Dans les faits, je réalise cette même tache environ 20 000 fois dans l’année. Environ 200 taches sont évaluées pour savoir si elles sont conformes ou non. Si mon taux de conformité est situé entre 99% et 100% j’aurais une note de X/10. si entre 98 et 99% j’aurais Y/10, et ainsi de suite.

Je cherche en gros à prouver (ou me donner tord) que l’échantillon qui est analysé est bien trop faible, par rapport à l’objectif (98%) élevé et le nombre de taches réalisées dans l’année, pour être vraiment représentatif de la qualité de mon travail.

J’espère avoir pu éclaircir quelques points :slight_smile:

Merci encore !

PS : 2 messages yes, je suis membre actif d’un autre forum en fait

Hello,

c’est des stats assez classique : on cherche à estimer le paramètre p d’une loi de Bernoulli. C’est à dire que p est la proportion théorique de « tâches conformes » par rapport au nombre de totale de tâches effectuées.

Tu dis qu’on t’évalue sur un échantillon de 200, donc l’estimation qu’on a pris pour p est égale à f = x/200 où x est le nombre de taches conformes sur les 200.
Après on évalue ce qu’on appelle un « intervalle de confiance » c’est à dire quel intervalle faut-il prendre pour que la proba que p soit dans [f - a , f +a] soit égale à 95% (si on s’autorise 5% d’erreur).

On approxime la loi binomiale par la loi normale qui donne un intervalle de confiance à 95% égal à [f - 1.96sqrt(f(1-f)/200) , f + 1.96sqrt(f(1-f)/200)]

donc par exemple si sur les 200 testées, on trouve f = 99%, tu as 95% de chance que le « vrai » p soit dans [0.9606 , 0.9994]

Il faudrait eventuellement affiner en n’approximant pas le loi binomiale (il me semble que quand p est proche de 1 ou 0, ça devient moins bon comme approximation)

cf par exemple : http://r2math.enfa.fr/wp-content/uploads/2010/07/15-5-intervalles.pdf

on peut aussi dire (ce qui est p-e ce qui t’interesse plus ici) que si on observe f = 0.985, la probabilité que p soit dans [0.98 , 0.99] est seulement de 43,8%

si je me suis pas trompé :slight_smile: et toujours avec l’approximation de la loi binomiale …

Salut pierremomo,

Je n’ai pas encore eu le temps d’étudier ta réponse en détails et voir comment je pourrais m’en servir exactement, mais ca me semble être exactement ce que je cherchais. J’ai quelques vagues souvenirs de la loi de Bernoulli et si je me rappelle bien c’était vraiment pas compliqué.

Merci bcp, je reviendrai dès que possible poser des questions complémentaires si nécessaire, ou simplement remercier les gens ayant répondu, de leur participation bien utile :slight_smile:

non effectivement Bernoulli c’est tout con : c’est juste un truc à 2 états et qui a une probabilité p d’être égal au premier état et de (1-p) d’être égal au second état.

Le nombre de « conformes » sur n échantillons suit lui une loi binomiale qui peut s’approximer par la loi normale si suffisamment d’échantillons et/ou si p pas trop proche de 0 ou 1

Bernoulli : Loi de Bernoulli — Wikipédia

Binomiale : Loi binomiale — Wikipédia

Normale/Gaussienne : Loi normale — Wikipédia

okok
pas mieux que Pierremomo toute façon:D

en tous cas pour la méthode, après pour le champ d’application let’s see

gl

Je pense que tu as les éléments mathématiques ici pour te débrouiller. En tant que juriste ce qui attire mon attention est surtout la manière dont on sélectionnera cet échantillon de 200, ça a d’ailleurs une importance dans le calcul qui t’intéresse.
Si on peut démontrer que cet échantillon n’est pas sélectionné de manière complètement aléatoire alors le calcul ne t’avantage jamais et l’évaluation est biaisée.

Puis demander 98% de réussite sur un échantillon de 5% me parait peu scrupuleux de toute façon, pas besoin de math pour ça. Mais comme le dit Yeepaa ça dépendra de la complexité de la tâche.

oui je pense aussi avoir les éléments mathématiques pour me débrouiller ! je peux clairement pas demander de faire tout le taf à ma place, et ca me fait assez plaisir de me replonger un petit peu là-dedans.

concernant la complexité de la tâche, j’imagine que l’idée est de savoir d’où vient l’objectif de 98% (parce que bon, il faut bien un critère objectif pour la déterminer, cette complexité). genre est-ce que c’est une moyenne de tous les employés, la médiane, un truc basé sur Gauss en fonction des perf de l’ensemble des employés, ou un truc complètement au pif, c’est ca l’idée?

à priori c’est aléatoire, mais j’ai aucun moyen de vérifier ou de prouver le contraire. je pars du principe que ca l’est de toutes façons. je suis pas sûr de comprendre les retombées que ca peut avoir dans le calcul en lui-même.