1
\documentclass{article}
3
\usepackage[utf8]{inputenc}
4
\usepackage[T1]{fontenc}
5
\usepackage[swedish]{babel}
10
\usepackage[sorting=none]{biblatex}
11
\bibliography{bibogrophy}
13
\title{Projektarbete: Dataanalys}
14
\author{Gustav Hartvigsson \\
15
Grebbestads Folkhögskola (VT 2011) \\
16
gustav.hartvigsson@gamil.com}
28
\section{Projektets syfte}
29
Syftet som jag hadde I projektplanen var följande:
31
Att träna på dataanalys/lära sig hur man gör dataanalys.
34
En längre beskrinving kunde vara: \emph{Att träna på dataanalys/lära sig hur
35
datanalys går till och se på olika metoder för att göra detta på.}
38
\section{Frågeställning}
39
Frågeställningen som jag hadde i projektplanen är följaned:
41
Se hur relationen mellan olika frågeställningar ser ut.
44
En längre och mer utförlig frågeställning skulla kunna vara: \emph {Se hur
45
relationen mellan olika svar är. Se tillexempel hur många veganer som är
50
Metoden beskrev jag i projektpalen är som följande:
52
Skriva en enkät med olika frågor som besvaras med kryssrutor.
54
Sedan stoppa in svaren i ett kalkylblad alt. en databas. där man kan göra
55
förfrågningar (querys) och skapa sig en bild av de olika grupperna på
59
Jag är ganska nöjd med med hur den är formuleringen. så jag anser inte att jag
62
\section{Presentation}
63
Jag hadde en presentation 2011 02 02, denna presentation skrevs i \LaTeX
64
\cite{latex.org:main} \cite{LaTeXWiki} och Beamer.
66
I Projektplanen skev jag följande:
68
Göra en presentation som redogör för relationerna mellan olika svar.
69
Även eventuellt göra ett program som kan göra querys på ett enkelt sätt.
71
Jag har tänkt att skriva presentationen i \LaTeX \ och visa upp programmet
75
I den här rapporten tänkte jag framföra lite statestik som visar olika
76
fågeställningar och deras relationer till varandra.
78
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
80
\section{varför jag valde de tekniker som jag gjorde}
82
\subsection{Programmet}
83
När jag tänkte på hur jag skulle lösa problemet kom jag att tänka på att det
84
vore lätt att ha all data i en sqldatabas och sedan använda sql förfrågningar
85
för att ta ut relationerna och räkna instanserna där det är sant.
87
Sedan behövde jag ett lätt använt språk att skriva en ``front-end'' i som jag
88
skulle kunna använda den för att lägga in data och ta ut data med. Med dessa
89
kriterier så blev valet Python 3.X \cite{Python.org:main} (även känt som
90
python py3k eller Python3k) detta blev dock ett problem, mer om detta i
91
sectionen ``Problem'' längre ner.
93
När det gäller valet av databas så var det inte så svårt, jag har arbetat med
94
SQLite förut och kräver inte en bakänsserver som jag skulle behöva använda
95
om ja hadde valt tillexempel MySql \cite{MySqlWiki} eller PostgreSql
96
\cite{PostgreSqlWiki}.
99
Enkäten skrev jag i klartext, dvs oformaterad och med bara stanard tecken för
100
att det skulla vara lätt att använda i Bazaar (se längre ner). och att det
101
skulle vara lätt att redegera.
103
enkätens struktur är som följande:
105
Först kom en kort beskrivning av projectet
107
sedan en liten information om hur datan skulle användas
112
Tror du på en/flera personlig(a) gud/gudar?
119
Jag använde Bazaar (även känt som bzr) som ett revitions kontroll system (RCV)
120
för att hålla koll på koden och som ett slags av dagbok över ändringar jag har
123
här kommer en beskrivning om vad Bazaar är för något frän Bazaars hemside:
125
Bazaar is a version control system that helps you track project history over
126
time and to collaborate easily with others. Whether you're a single
127
developer, a co-located team or a community of developers scattered across
128
the world, Bazaar scales and adapts to meet your needs. Part of the GNU
129
Project, Bazaar is free software sponsored by Canonical.
130
\cite{bazaar:com:main}
135
När jag började på projektet hadde jag en idé om att det skulle vara lätt att
136
produsera en enkär och sammanställa det i en databas, men värkligheten var
137
inte så lätt. I den här sektionen kommer jag att berätta om de problem jag har
138
haft under projektets gång.
140
\subsection{Programmet}
141
Jag hadde lite problem när jag gjorde progremmet som jag gjorde, här kommer
142
lite exempel på det som jag träffadepå.
144
\subsubsection{Bibliotek}
145
När jag valde Python visste jag att det fanns mängder av bibliotek som kunde
146
användas för att att gita grafer i, men jag tänkte inte på att de inte fanns
147
i Python 3k. Detta resulterade i att jag inte kunde göra grafer i pogramet som
148
jag skerv. jag gjorde en ``utflyckt'' i konsten att porta från ett py2.x till
149
py3k (se \cite{LP:GH:PGCP3k}), men jag lade ner det effter som att jag inte
150
förstod hur bibleoteket fungerade. Det ända jag gjorde var en enkel portning
151
så, trotts att den var användbbar, hadde den inte alla funktioner som
154
\subsubsection{debugning}
155
Jag utförde aldrig någon ordentlig debuging innan jag försökte lägga in
156
svaren i databasen, detta resulterade I att programmet krachade vid andra
157
körningen av ``add to db''. Felet var att jag inte ränsade strängen som jag
158
sedan använde för att lägga till data i databasen innan jag började på med att
159
lägga till mer data till den.
161
Detta blev fixat i revition med namnet ``\texttt{
162
gustav.hartvigsson@gmail.com- 20110131122114-e6e1z0pl2eadau65 }''
163
(se \texttt{bzr glog} eller \texttt{bzr log}).
165
%lägg upp koden på LP och referera till den där istället.....?
168
När det kommer till enkäter så var det lite problem. Bland annat så var inte
169
svarsrutorna för fråga 9 inte på samma sida som frågan.
171
Ett annat problem var att jag stavade fel på frågan 4 och 20, där jag skrev
172
\emph{sekelärt} istället för \emph{sekulärt} och \emph{morerna} istället för
175
Andra problem som var med själva frågeställningen var att vissa inte ville
176
svara på med ett klart ja eller nej. Detta var ett problem som jag skulle ha
177
förutsätt när jag gjorde frågorna,men det gjorde jag inte.
179
Ett tredje problem som jag hadde var att vissa inte svarade på vissa frågor.
180
Mer om detta längre ner.
182
\part{data och analys}
183
Här kommer jag att skriva om der data analysen gick till och hur jag löste
184
vissa problem som uppstod, och eventuellt visa någon fin graf som visar hur
185
de olika reationerna ser ut.
188
Jag fick in 44 svar på enkäten, som nu mera finns i en databas, som jag kommer
189
att lägga ut på nätet innom en snar framtid tillsammans med programmet.%FIXME
191
Så här ser ett stycke av databasen ut i csv format.
193
id,gudar,spoken,religos,sekulart,vegan,mars,globaluppvarmning [...]
194
1,0,0,0,1,0,1,1,1,0,0,0,1,0,1,1,1,1,0,1,1,0,0,1," "
195
2,0,0,0,1,0,0,1,1,1,1,1,1,1,0,1,1,1,0,1,1,0,1,1," "
196
3,0,0,0,0,0,0,1,1,0,1,1,1,1,1,1,1,1,0,1,1,0,1,1," "
197
4,0,0,0,1,0,1,1,1,1,1,1,0,1,0,1,1,1,0,1,1,0,1,0," "
198
5,0,0,0,1,0,1,1,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0," "
199
6,1,1,0,1,0,1,1,1,0,1,1,1,1,0,1,1,1,0,1,1,0,1,0," Du skull [...]
201
Se \texttt{csv/awnsers2.cvs} för datan i csv format %FIXME Länka till datan på LP när den är upplaggd.
202
eller \texttt{awnsers.sqlite} för datan i SQLite3 format.
204
Datans struktur är inte så märkvärdig: 1 är sannt och 0 är falskt.
206
\section{tabeller och grafer.}
208
I den här sektienen kommer jag att gå genom lite statestik äver vilka
209
kopplingar som finns mellan olika frågeställningar som var med i enkäten.
214
\begin{tabular}{ c | c | c | c | c | c | c | c | c | c | }
216
\begin{sideways} Tror på gu(ar) \end{sideways} &
217
\begin{sideways} Tror på spöken \end{sideways} &
218
\begin{sideways} Är religös \end{sideways} &
219
\begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
220
\begin{sideways} Vegan eller vegitarian \end{sideways} &
221
\begin{sideways} Är för abort \end{sideways} &
222
\begin{sideways} Är för kvinnors rättigheter \end{sideways} &
223
\begin{sideways} Är för dödsstraff \end{sideways}
225
Tror på gud(ar) & & 11 & 7 & 16 & 4 & 17 & 17 & 1
227
Tror på spöken & 11 & & 5 & 13 & 6 & 17 & 18 & 2
229
Är religös & 7 & 5 & & 6 & 3 & 8 & 8 & 0
231
Är för ett sekulärt sammhälle & 16 & 13 & 6 & & 6 & 35 & 35 & 2
233
Vegan eller vegitarian & 4 & 6 & 3 & 6 & & 8 & 9 & 0
235
Är för abort & 17 & 17 & 8 & 35 & 8 & & 42 & 4
237
Är för kvinnorsrättigheter & 17 & 18 & 8 & 35 & 9 & 42 & & 4
239
Är för dödsstraff & 1 & 2 & 0 & 2 & 0 & 4 & 4 &
241
av totalt & 18 & 19 & 9 & 35 & 9 & 42 & 43 & 4
244
\caption{Ett litet urval av datan}
245
\label{table:LitetUrval}
249
Datan I tabellen är framställd via at använda \texttt{count} funktionen i
250
programmet under \texttt{showDB}. Ett exempel på hur man kan göra:
251
\texttt{(cmd) count vegan and dodsstraff} detta skriverut siffran \texttt{0}
254
Här kommer en tabell med procentsattser som är producerade genom
255
\begin{math} \frac{cell}{tot_x} \end{math} och
256
\begin{math} \frac{cell}{tot_y} \end{math}.
257
See tabbell \ref{table:ProcentLitetUrval} på sidan
258
\pageref{table:ProcentLitetUrval}.
264
\begin{tabular}{ c | c | c | c | c | c | c | c | c | c |}
266
\begin{sideways} Tror på gu(ar) \end{sideways} &
267
\begin{sideways} Tror på spöken \end{sideways} &
268
\begin{sideways} Är religös \end{sideways} &
269
\begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
270
\begin{sideways} Vegan eller vegitarian \end{sideways} &
271
\begin{sideways} Är för abort \end{sideways} &
272
\begin{sideways} Är för kvinnors rättigheter \end{sideways} &
273
\begin{sideways} Är för dödsstraff \end{sideways}
275
Tror på gud(ar) & x & 61\% & 38\% & 89\% & 22\% & 94\% & 94\% & 5,5\%
277
Tror på spöken & 61\% & x & 28\% & 68\% & 33\% & 89\% & 95\% & 11\%
279
Är religös & 38\% & 28\% & x & 66\% & 33\% & 89\% & 89\% & 0\%
281
Är för ett sekulärt sammhälle & 89\% & 68\% & 66\% & x & 17\% & 100\% &
284
Vegan eller vegitarian & 22\% & 33\% & 33\% & 17\% & x & 89\% & 100\% &
287
Är för abort & 94\% & 89\% & 89\% & 100\% & 89\% & x & 100\% & 10\%
289
Är för kvinnorsrättigheter & 94\% & 95\% & 89\% & 100\% & 0\% & 100\% &
292
Är för dödsstraff & 5,5\% & 11\% & 0\% & 5\% & 0\% & 10\% & 9\% & x
295
& \begin{sideways} 100\%/18 \end{sideways}
296
& \begin{sideways} 100\%/19 \end{sideways}
297
& \begin{sideways} 100\%/9 \end{sideways}
298
& \begin{sideways} 100\%/35 \end{sideways}
299
& \begin{sideways} 100\%/9 \end{sideways}
300
& \begin{sideways} 100\%/42 \end{sideways}
301
& \begin{sideways} 100\%/43 \end{sideways}
302
& \begin{sideways} 100\%/4 \end{sideways}
305
\caption[Procent: Ett urval av datan]{samma data som i tabell
306
\ref{table:LitetUrval} fast i procent.}
307
\label{table:ProcentLitetUrval}
311
Utifrån datan så har jag sammanställt datan i ett diagram, som visar olika
312
kollomner som har summerats, se figur \ref{graph:summaavkollomener} på sidan
313
\pageref{graph:summaavkollomener}. alla ettiketer är inte med i diagrammet,
314
så här kommer ettiketerna i samma ordning:
316
gudar, spoken, religos, sekulart, vegan, mars, globaluppvarmning,
317
manen, motion, sund, deprimerad_host, sno, oppet,dodsstraff,
318
kvinnors_rattigheter, abort, kvinnors_kropp, deprimerad_var,
319
vetenskap, evolutionen, gast_sverige, fodd_sverige,
320
foraldrar_sverige, komentarer
325
\caption[Summa av frågeställningar.]{En figur som visar summan av de olika
327
\includegraphics{Graph_summa_av_kollomner.eps}
328
\label{graph:summaavkollomener}
331
\section{Analys av datan och jämförelse med annan statistik}
332
bla bla bla bla bla bla....
334
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%