Mathématiques et méthodes statistiques pour l'analyse génétique

December 1

Mathématiques et méthodes statistiques pour l'analyse génétique


La génétique est une branche de la biologie concernés par l'étude des gènes, la variation, et héréditaire chez les animaux et les plantes. Mathématiques et statistiques jouent un rôle important dans la discipline de la génétique, en particulier la sous-discipline de la génétique des populations. La génétique des populations étudie la fréquence et la répartition des différents allèles dans une population donnée d'organismes et comment ils se rapportent à d'autres populations d'organismes. Les allèles sont des parties du code génétique qui sont liés à des attributs particuliers.

Moyennes

La forme la plus élémentaire de l'analyse statistique est la moyenne. Il existe trois types de moyenne: moyenne, la médiane et le mode. La moyenne se trouve en trouvant la somme d'un ensemble de données et en divisant cette somme par le nombre de points de données. La médiane est trouvé par tous les points de données par ordre de taille et en sélectionnant le point de données du milieu. Le mode est simplement la valeur de données apparaissant le plus fréquemment. Les trois types de moyenne sont utilisés dans la génétique des populations, mais le plus commun est la moyenne.

Variance

La variance est une mesure de combien les valeurs dans un ensemble de données varient. La variance est symbolisé par s ^ 2, ou d'un sigma carré symbole. La variance est calculée en trouvant la somme des carrés des différences entre chaque valeur et la valeur moyenne, et en divisant ensuite par une inférieur au nombre de points de données. Un exemple de la variance pourrait impliquer le nombre de taches sur une espèce particulière de coléoptères. Supposons qu'il y ait cinq coléoptères dans l'ensemble, et le nombre de taches sur chaque coléoptère sont 5, 5, 6, 6 et 8. La moyenne est:

(5 + 5 + 6 + 6 + 8) / 5 = 6

La variance est calculée comme suit:

[(5-6) ^ 2 + (5-6) ^ 2 + (6-6) ^ 2 + (6-6) ^ 2 + (8-6) ^ 2] / (5 - 1) = 1,5

Cela nous donne une indication de la propagation des valeurs.

standard Deviation

L'écart type est une autre mesure de la propagation. Il est la racine carrée de la variance. Il a l'avantage qu'il possède les mêmes unités que l'ensemble de données est dérivé. Dans l'exemple donné ci-dessus l'écart type est:

(1,5) ^ (0,5) = 1,22474

Cela indique que l'écart type du nombre de taches sur la population de coléoptères est d'environ 1,22 points.

Corrélation

La corrélation est une mesure de la quantité de liaison entre deux ensembles de données. Dans la génétique des populations, les corrélations peuvent être utilisées pour étudier la relation entre la possession des gènes et des occurrences de caractéristiques particulières particulières. La corrélation est symbolisée par un groupe R avec l'indice xy, où x et y sont des variables des deux ensembles de données. Les corrélations sont toujours entre -1 et 1. -1 signifie qu'il existe une corrélation négative, 0 signifie qu'il n'y a pas de corrélation, et 1 signifie qu'il ya une corrélation positive.

Régression

La régression est un outil statistique utilisé pour trouver la relation entre deux variables. Le coefficient de régression a donné le symbole b avec l'indice yx, où y et x sont des variables des deux ensembles de données. Le coefficient de régression mesure la variation prévue de la ay variable par un changement d'unité dans la variable x.

Troubles génétiques Nomenclature

Lors de la discussion trouble génétique, il y a plusieurs termes techniques qui décrivent le motif de la maladie dans la population générale. Ces termes comprennent l'incidence, la prévalence, la mortalité et le risque à vie. L'incidence d'une maladie génétique est la proportion de personnes dans la population avec un trouble génétique particulier. La prévalence d'une maladie génétique est le nombre de personnes au sein d'un sous-groupe spécifique, comme un groupe d'âge particulier, qui ont un trouble génétique particulier. La mortalité se réfère au nombre de personnes dans un groupe particulier qui meurent d'un trouble particulier par an. Un exemple d'une statistique de mortalité pourrait être «10 000 personnes aux États-Unis sont morts du syndrome X en 2010." Le risque à vie est le risque moyen de développer un trouble génétique particulier à un moment donné dans la vie d'un individu.