代写PSTAT 122 Project Description代做Python程序

PSTAT 122

Project Description

Your final project is due on Wednesday 6/11/25 at midnight.

Preliminary notes:

•  All projects are to be done individually

Please do not discuss your work on your projects with any other students in the class at all. As these final projects are in lieu of a final exam, you should essentially treat this as a take-home final exam.

•  Below are a number of suggested options that you might do for your final project.  You are welcome to choose one of these, or propose your own idea (as also described below).

If you propose your own idea, you must submit a brief description of your plan to Canvas, by Wednesday May 14th at midnight.

Unless you are doing a simulation study (Option 3 below), all projects must involve the collection of real data.

If proposing your own real data idea:

* It must fit either a Block Design or Full Factorial Design  (with or without blocking) as described below

*  The data must be COLLECTED BY YOU and it must be a designed experiment.  Obser- vational data are not in the realm of this course so be sure that what you are proposing is indeed an experiment and not just observational.

•  The AI policy for projects is the same as it has been for this entire course:  you are welcome to use it, but please do so carefully, and with appropriate crediting for anything that you have AI help you with.

Please choose from one of the following options:

1) Randomized  Complete  Block  Design  (RCBD)  or  Generalized  Randomized Block Design (GRBD)

In this option, you will design and implement an experimental study with one primary factor of interest and one blocking variable. Here is one possible suggestion:

i) Online Survey GRBD

Create an online survey via any platform of your choosing such as Google Forms that you will distribute to fellow UCSB undergraduate students. Your survey will primarily consist of ONE statement on a potentially controversial topic (i.e. political, something about campus, etc).

Specifically:

• Your factor of interest will be the wording of your statement.

The different wordings should not change the overall message of the statement; that is, the core message of the statement should remain the same, but your versions of the statement may differ in ways such as tone, emphasis, or peripheral information surrounding the statement.

• Your outcome of interest will be a score from 0 to 10 indicating the respondent’s degree of agreement with the statement.

• Your blocking variable will be the class standing of the student.  You may choose to keep it only to traditional Freshmen/Sophomores/Juniors/Seniors, or you may make it more flexible.  Either way, the only other question in your survey will be the class standing of the student.

You should either create a separate survey for each version of the statement and distribute the links to these at random, or create one survey that is set up such that it will provide a version of the statement at random. You should have at least 3 versions of the statement to compare.

How you distribute your survey is up to you; for example, you may email it to individuals or to a group email list, or you may post it on your social media account, or a combination of these two; if you are distributing different links for each version of the statement, you will need to have a way to do this randomly.  Your report should discuss the implications of how you distributed your survey in terms of whether you have truly obtained a random sample or not, and how this might impact your results.

Unlike in the RCBD, you will potentially have many replicates within each block.  You just need to make sure that you have each treatment group represented at least once in each block, but potentially many more times depending on your sample size calculations.

ii) Your own design

You may also design your own RCBD or GRBD experiment.  It must have one factor of interest with at least 3 levels, and one blocking variable with at least 3 blocks. You may also choose the above option but modify it in any way to your liking as long as it is still a RCBD or GRBD with the required number of levels and blocks.  If you choose to design your own RCBD or GRBD or make modifications to the above suggestion, you must submit a brief description of your plan to Canvas by Wednesday May 14 (as noted above) so that we can ensure that it is a proper design and that it will be feasible in the time that you have before the deadline.

2) Full Factorial Design

In this option, you will design and implement a study with at least two primary factors of interest.  Here are two possible suggestions:

i) Paper Airplanes Factorial Design

Similar to Lab 5, but instead of an RCBD, you will have multiple factors of interest to do a full factorial experiment. The factors are:

•  Paper clip on the nose (yes/no)

•  Paper clip on the middle (yes/no)

•  Paper clip on the rear (yes/no)

That is, you could potentially have 2 or 3 paper clips on the airplane in any given replicate, unlike in the Lab 5 RCBD where you always had exactly 1 paper clip or 0 paper clips on the airplane.

The outcome of interest is again how far the airplane flies when you throw it. Your experiment should have multiple replicates, with the number of replicates determined by a sample size calculation (to be discussed further in class).

ii) Soda Taste Test Factorial Design with Blocking

Obtain a sample of multiple cans or bottles of any brand of soda (to be more economical, you might want to try to find a large pack of the smallest individual size possible).  The number of cans/bottles that you obtain may be guided by your sample size calculations.  The question at hand here is whether two factors of interest have any impact on the enjoyment (taste or otherwise) of drinking the soda.

The factors of interest are:

•  Method of pouring:

Down the side of the glass

Straight onto the center of a glass

Leave it in the can/bottle

•  Method of consumption:

Via a straw

Straight from the container

Find participants to taste the soda according to each of the conditions.  As each participant will try every combination of conditions, the participants are thus each a block.  Participants should rate each taste on a scale of 0 to 10.

iii) Your own design

You may also design your own factorial experiment. It must have either:

•  2 factors with at least one of the factors having at least 3 levels

•  3 or more factors, in which case each factor may have only 2 levels (but more is also just fine)

You may also choose one of the above options but modify it in any way to your liking as long as it is still factorial design with the required number of factors and levels.  If you choose to design your own factorial experiment, you must submit a brief description of your plan to Canvas by Wednesday May 14th so that we can ensure that it is a proper design and that it will be feasible in the time that you have before the deadline.

3) Simulation Study of the TukeyHSD test

i) Comparing TukeyHSD to ANOVA

In this option, you will design and implement a simulation study in which you will investigate the TukeyHSD test. Your aims of this option are two-fold (your project must investigate both):

•  Aim 1: Demonstrate that, if the ANOVA conditions are met, the TukeyHSD test maintains an overall Type I Error rate of approximately α = 0.05, for the probability of making at least one Type I Error

•  Aim 2:  Compare the power of the TukeyHSD test to the ANOVA  (again you may assume that the ANOVA conditions are met).

That is:  our  usual ANOVA workflow is to perform the ANOVA first to see if there are ANY differences between the groups, and then follow that with a TukeyHSD test.

*  One natural question to ask is, why do we do this?  In other words, why don’t we just do TukeyHSD and forego the initial ANOVA analysis?

*  The standard answer is that the TukeyHSD test is more prone to miss any significant dif- ferences, because its adjustment for the overall Type I Error rate costs it some statistical power.

*  Here, Aim 2 is to investigate this claim via simulation.

For each of the above aims, your simulation study should investigate a large variety of scenarios.  Specifically,

•  For Aim 1:

You should investigate how your results vary (or not) across varying numbers of treatment groups (e.g. 4, 5, or 6 groups).  You should have at least 3 such scenarios (it can indeed just be 4 through 6, or you may choose other numbers).

You may otherwise keep the following constant across your simulations (but you should make sure to clearly and carefully state what they are in your project write-up):

*  Group mean

*  Group variance

*  Sample Size per group

Here, a Type I Error has occurred for the TukeyHSD test if at least one of the pairwise p-values is less than 0.05 (equivalently, if the smallest pairwise p-value is less than 0.05).

•  For Aim 2:

You should investigate how your results vary (or not) across the following two factors:

*  number of treatment groups

·   Again you should have at least 3 different levels (e.g. 4, 5, or 6 groups)

*  effect size (i.e. the group means and how different they are from each other)

·   You should have at least 3 different levels here as well.

* Your simulation study should investigate every combination of these two factors (so for Aim

2 alone, you would have a total of 3 × 3 = 9 scenarios to simulate).

You may otherwise keep the following constant across your simulations (but you should make sure to clearly and carefully state what they are in your project write-up):

*  Group variance

*  Sample Size per group

For the TukeyHSD test: for simplification, you may count each replicate as a correctly identified significant result if at least any one of the pairwise p-values is less than 0.05.

While you can run initial simulations at lower repetitions/iterations as you investigate, in your final report your Type I Error probabilities and power should be estimated with at least 10,000 iterations per scenario. You can expect it to take a long time to run all of your required simulations at this level (likely 30 minutes or more, after you have it coded correctly).  It will be best if your simulations are written in a script file, which then saves your output to an RData file, and then your Rmd file reads in the RData file; it will be overly cumbersome to write simulations of this magnitude in an Rmd file.  If you do not know what all of this means, this project option is probably not a wise choice.

ii) Your own designed simulation study

You are welcome to modify the above suggestion and/or propose your own simulation study entirely.  For example, you might be interested in investigating the impact of model misspecification on the performance of the TukeyHSD test, and compare it to its relevant permutation test (which you would have to write as part of your project). If you choose to design your own simulation study, you must submit a brief description of your plan to Canvas by Wednesday May 14th so that we can ensure that it is a proper design and that it will be feasible in the time that you have before the deadline.

Specific Expectations

A grading rubric and a skeleton project example that highlights the expectations of your report will be made available by Friday May 9th.


热门主题

课程名

mktg2509 csci 2600 38170 lng302 csse3010 phas3226 77938 arch1162 engn4536/engn6536 acx5903 comp151101 phl245 cse12 comp9312 stat3016/6016 phas0038 comp2140 6qqmb312 xjco3011 rest0005 ematm0051 5qqmn219 lubs5062m eee8155 cege0100 eap033 artd1109 mat246 etc3430 ecmm462 mis102 inft6800 ddes9903 comp6521 comp9517 comp3331/9331 comp4337 comp6008 comp9414 bu.231.790.81 man00150m csb352h math1041 eengm4100 isys1002 08 6057cem mktg3504 mthm036 mtrx1701 mth3241 eeee3086 cmp-7038b cmp-7000a ints4010 econ2151 infs5710 fins5516 fin3309 fins5510 gsoe9340 math2007 math2036 soee5010 mark3088 infs3605 elec9714 comp2271 ma214 comp2211 infs3604 600426 sit254 acct3091 bbt405 msin0116 com107/com113 mark5826 sit120 comp9021 eco2101 eeen40700 cs253 ece3114 ecmm447 chns3000 math377 itd102 comp9444 comp(2041|9044) econ0060 econ7230 mgt001371 ecs-323 cs6250 mgdi60012 mdia2012 comm221001 comm5000 ma1008 engl642 econ241 com333 math367 mis201 nbs-7041x meek16104 econ2003 comm1190 mbas902 comp-1027 dpst1091 comp7315 eppd1033 m06 ee3025 msci231 bb113/bbs1063 fc709 comp3425 comp9417 econ42915 cb9101 math1102e chme0017 fc307 mkt60104 5522usst litr1-uc6201.200 ee1102 cosc2803 math39512 omp9727 int2067/int5051 bsb151 mgt253 fc021 babs2202 mis2002s phya21 18-213 cege0012 mdia1002 math38032 mech5125 07 cisc102 mgx3110 cs240 11175 fin3020s eco3420 ictten622 comp9727 cpt111 de114102d mgm320h5s bafi1019 math21112 efim20036 mn-3503 fins5568 110.807 bcpm000028 info6030 bma0092 bcpm0054 math20212 ce335 cs365 cenv6141 ftec5580 math2010 ec3450 comm1170 ecmt1010 csci-ua.0480-003 econ12-200 ib3960 ectb60h3f cs247—assignment tk3163 ics3u ib3j80 comp20008 comp9334 eppd1063 acct2343 cct109 isys1055/3412 math350-real math2014 eec180 stat141b econ2101 msinm014/msing014/msing014b fit2004 comp643 bu1002 cm2030
联系我们
EMail: 99515681@qq.com
QQ: 99515681
留学生作业帮-留学生的知心伴侣!
工作时间:08:00-21:00
python代写
微信客服:codinghelp
站长地图