Çilek Ağacı

Cem was at the inaugural Information is Beautiful Awards ceremony & party at the Institute of Contemporary Arts in London because our work Metallica on Stage was shortlisted in the Data Journalism category.

The Awards were created in partnership by leading data visualisation studio Information is Beautiful and world leader in research and insight Kantar as the world’s first global contest to celebrate excellence and beauty in data visualization, infographics and data journalism. There were over 1000 entries from all over the world, competing in six main award categories: Data Visualization, Infographic/Infodesign, Interactive Visualization, Data Journalism, Motion Infographic, and Dataviz Tool or Website.

The judges were Brian Eno, Paola Antonelli (senior curator, Museum of Modern Art), Simon Rogers (editor, The Guardian datablog), Maria Popova (cultural curator, writer and master blogger), Aziz Cami (creative director, Kantar) and David McCandless (author, data journalist & information designer; creator of the popular blog and best-selling book Information is Beautiful). There was also an online community voting that affected all the category awards, plus one Community Award based on just the online voting.

With Metallica on Stage, we won two beautiful awards: the Bronze award in the Data Journalism category placing third after Stamen (CNN) and Guardian, and the Community Award. Thanks to David, his team and Kantar for organizing this inaugural event. And congratulations to all the other winners and long/shortlisted participants.

Photos by Bilge Kobaş

In January 2012, The Information is Beautiful Awards launched a data visualization challenge for Hollywood films from 2007–2011, providing an ”ultra-comprehensive dataset that lifts the lid on opening weekends, worldwide gross, budgets, storylines, review scores – everything – for every Hollywood film released in the last five years.” (Some movies that were released in late 2011 do not have enough data to be fairly represented in this visualization.)

Our submission, which wasn’t really finished due to our workload at the time, was shortlisted along with eleven others. Here we publish our finalized version with a more refined group-coloring for the genres, the addition of a size key to the legend, and the average and sum values for each genre as well as the sum values for all the 656 movies in the dataset (click on the image to see a larger version).

High-quality prints of different sizes and materials of this poster can be bought here, with worldwide shipping. (The png file you see on the web isn’t good for printing.)

Buy This

It’s worth mentioning that we made some changes to the genre assignments given in the original dataset. Specifically, we placed Avatar and the series of Harry Potter and Chronicles of Narnia in fantasy; the Twilight Saga in romance, The Last Exorcism and the Saws in horror, and Slumdog Millionaire in drama.


How to read the plots

For each element (movie or genre), we visualize two values – the budget and the worldwide gross revenue – with two concentric circles, where the area of the lighter shade circle represents the revenue. In the cases of the main graph (single movies) and the inset graph (averages for genres), these circles are plotted on an x-axis representing sustainability and a y-axis representing profitability. We calculate the sustainability of movies by dividing gross revenue by the opening-weekend revenue, and profitability by dividing gross revenue by the budget. These axes are logarithmically scaled in order to accommodate the wide range of values.

A high ratio of the gross revenue to the opening-weekend revenue indicates that the movie enjoyed a sustained interest and continued to generate revenue as the weeks passed. The movies that lie on the right-side of the plot have larger sustainability values.

The thick horizontal y=1 line indicates the region where the revenue and budget of a film is equal to each other. Below the line are movies that generated less revenue than their budgets – their lighter circles are inside the dark ones. However, since a movie typically needs to generate two to three times of its production budget to be deemed profitable (1, 2), the threshold where real profitability starts is higher above. The area below that threshold – where the movies that were not profitable are – is shown with darker gray, starting with the gradient.

At the bottom part of our visualization we see the big circles representing the total budgets and revenues of genres, ordered by the size of the outer circle, i. e. the gross revenues that they have generated, plus the huge gray circles for the total values for all the 656 movies included in the dataset. (This last part obviously is independent from the axes of the main graph.)

All circles on this visualization are drawn in the same scale, thus comparable to each other in size. The colors of all these circles are determined according to a 5-color grouping that we created for the genres of movies, which can be seen in the legend.



The action group appears to do worst in profitability.

Fantasy and animation movies follow a diagonal line, whereas horror movies look scattered along a vertical area with low sustainability. We also note that horror movies usually have very small budgets, and do much better than the other genres in the y-axis at both ends; they go higher than and not as low as the others. We can say that, for horror movies, the budget is not necessarily a good predictor of success in terms of profitability. From a profitability point of view, it may be wise for filmmakers to invest in horror movies if they don’t have much money to put in a single film. This makes sense from a sustainability point of view as well: after all, if a movie is a hit it will pay off its budget (and more) in the first weeks following the opening weekend, and if it is not it will be evident in the opening weekend and it will be easier to pull the movie out of the theaters – an effective measure to cut the costs by eliminating further promotion and advertisement.  

The typical patterns of fantasy/animation and horror movies are apparent also in the inset plot where the average budget and revenue values of each genre is plotted. The bottom graph shows that the total amount gained from fantasy is considerably larger than the amounts of drama, thriller or adventure, all having similar total budgets. These observations suggest us that we may see more horror and fantasy/animation movies in the next years, although the question of whether this is a new trend or a permanent condition remains to be answered.

The number of movies that are below the profitability range is substantial. Filmmaking is a risky business and production companies should be careful in risk management. Here are some links related to the risks and prediction of success in movie business: 1, 2, 3.

The movies with the Academy Award for Best Picture are marked with the silhouette of the Oscar statuette. These movies seem to be doing well on the sustainability axis, although this probably is a mixed result of their success in the eyes of the audience and the second life that they enjoy in theaters during their post-Oscar fame.

And yes, Paranormal Activity really is located at that position in the main graph – a dramatic display of its profitability.


Winner of the Bronze Medal in Data Journalism and of the Community Award in the inaugural Information is Beautiful Awards (2012). Listed in the 20 Great Infographics of 2012 on Visual.ly.

This is an examination of Metallica’s concert history from 1982 to 2012 with a focus on the numbers of songs played live and the albums that they belong to. We took the raw data from Setlist.fm (plus Last.fm in the last part), groomed it and visualized it with our own tools.

The colors of the albums – a key feature of the whole visualization – are chosen according to the album cover artworks; Metallica fans can easily understand which color corresponds to which album without reading their names. As a convenient surprise, new albums (Load, Reload and St. Anger) that are stylistically different from the old ones are all tints of orange-yellow and this provides a natural visual grouping in the charts. (Try to see this grouping when you look at the charts.) Death Magnetic, which is their newest album but musically much closer to the old ones, has its brownish gray shade (again, taken from the real album cover), and that separates it visually from the Load – St. Anger period.

High-quality prints of different sizes and materials of this poster can be bought here, with worldwide shipping. (The jpg file you see on the web isn’t good for printing.)

Buy This

In the first chart, the number of concerts given each year is plotted. In the second chart, the bar heights represent the absolute numbers of songs played from each album. The album release dates are marked on the grid columns with the corresponding colors.

The years 1982–91 are a very intense period for Metallica; they write a vast majority of the songs that are played live even today, and are involved in extensive touring. We can see that in the eves of the first four albums, Metallica continues to play gigs. With the self-titled fifth album, the band starts to quit touring and takes more time for songwriting before releasing albums. Maybe this is one of the sources of the famous “problem” (according to the oldschool first-four-albums metalheads) with the new albums; maybe Metallica shouldn’t be left alone before albums. This idea is consistent with the case of Death Magnetic which is not written in absolute isolation according to the chart, and has largely won the hearts of oldschool fans.

The year 1992 sees the climax of touring in Metallica’s carrier where each album reaches their all-time maximum play counts (except Justice), all dominated by the “Black Album”s overwhelming numbers.

Looking at 1996–97 we observe that Load-Reload songs seem to go well with the Ride the Lightning songs in a way that the remaining of the first-four-albums don’t. Interestingly, Reload never reaches the explosive levels of playing of Load after its release but it enjoys a more stable carrier afterwards (thanks to Fuel and The Memory Remains) compared to Load, ultimately not falling too far behind it in total play count (1115, 696).

St. Anger comes after the longest break in Metallica’s touring history (for obvious reasons) and lives the short and brutal life of a monster. (It is seen as their worst album by the oldschool fans.) It’s clear that Metallica aren’t happy with playing St. Anger songs live. It seems like Death Magnetic songs arrive to put St. Anger out of its misery; this is the only case in Metallica’s history where a new album entirely cuts the play count of the previous one. It can also be seen that Death Magnetic songs enjoy the company of the older songs instead of Load-Reload.

In the second part of our examination is a map of the places where Metallica has played live. The opacity of the red outer circles correlates with the number of concerts given in that city. The details about the northern- and the southern-most gig venues where Metallica has played are given in trivia boxes.

In the third part we see the total play counts by albums and songs. As expected, the most played songs are from the old albums, and the least played are from the new ones. But what if there was a way to compare the real “performances” of the songs in concert setlists, independent from their release date? To address this question, in the next part, we introduce the concept of Power.

Song Power is calculated by dividing the total play count of the song by the number of concerts after its first playing date. Album Power is the total play count of the songs from the album divided by the number of all songs played in all concerts after the date when a song from that album was first played (which may be before the release of that album) and then divided by the number of songs on it. This is a normalization to eliminate the advantage that the old songs have (they had more time to be played) in order to create more neutral rankings. You can also say that a song with the Power value 0.945 has a 95% chance of being played in the next concert. The Album Powers are additionally normalized with respect to the numbers of songs on the albums. (The Album Power values on the chart are multiplied by 10 for presentation efficiency.)

We see that the rankings change when we eliminate the time factor. Enter Sandman takes the lead as the most Powerful song and Death Magnetic, their latest album, beats all the old albums in Power; this means that Death Magnetic had a greater share of setlists after its release than the other albums did in their own lifetimes in average. Two songs from Death Magnetic are already in the Top 10 Most Powerful Songs list, prevailing over classics like For Whom the Bell Tolls and Seek & Destroy. Another way of thinking about Power is this: given enough time, Death Magnetic may well be in the top ranks of the Total Count by Albums list whereas Load, Reload and St. Anger do not seem to be moving from where they are. (Note that if we did the same analysis in 1997 we would have been saying a similar thing about Load; time will tell whether Death Magnetic’s Power will subsist.) S&M with its two songs presents an interesting case as it moves on top of the “Orange Albums” thanks to the song number normalization.

This part also contains the complete list of Metallica songs never played live in their entirety; among them are songs that are played in part (for instance, until the second verse part) or have been featured as riffs in a jam. Here Reload sticks out as the album with the most songs that are never played live. Kill ‘Em All and Master of Puppets are albums that had all their songs played live at least once.

In the fifth part we plot the Song Power on the y-axis with song durations on the x-axis. Here the first thing that strikes us is a pattern of orange-yellow squares tiling the lower part of a diagonal line between the upper left and the lower right corners. This tells us that songs from the Orange Albums tend to lose their Power as they get longer in duration; there isn’t one song from Load, Reload or St. Anger among the 19 songs located above that diagonal. This plot also gives insight about the natures of the individual albums thanks to the color-coding; for instance, it is easy to see that the black squares are grouped in the left half of the plot, meaning that the album Metallica consists of shorter songs in average.

Finally we make a comparison between the personal listening statistics taken from Last.fm and the concert setlists (after 2002 when Last.fm was founded). On the left are songs that have a greater share within Last.fm than within setlists in total, and the songs with greater share within setlists are on the right of the axis. This chart suggests that the band may further please the audience by playing songs from the left end (The Unforgiven, The Unforgiven II, etc.) more in concerts. The fact that there are fewer songs on the right side and their bars are much higher than the ones on the left side tells us that the setlist and Last.fm statistics have different distributions: there are songs that Metallica plays on almost every show and there are songs that they have never played live whereas Last.fm listening statistics are much more homogeneous.

[Personal addendum: In addition to all the objective analysis above, I would like to state as a fan that I love the Orange Albums as much as I love the old ones, and I am thrilled to see them played live. — Cem]

Praise on Social Media

  • andypotter (Andrew Potter) Lustig and also insane.
  • jmlacroix (Jean-Michel Lacroix) L’infographique le plus intéressant de 2011.
  • nag_acharya (Nagaraj Acharya) Whoa! This is for those of you who are doing a PhD on Metallica.
  • tmbrntt (Tom Barnett) not exactly a metallica fan but this is an all-time favourite infographic.
  • bquarant (Brian Quaranto) The infographic bar has been raised again.
  • clipperhouse (Matt ☼ Sherman) OK, this is actually an infographic. (Most “inforgraphics” are just lists done in Illustrator.)
  • DannyJWillis (Danny Willis) My new favorite data visualization ever.
  • dkastner (Derek Kastner) Here’s an infographic that’s actually informative, novel, and presents data effectively.
  • Fitoria (Adolfo Fitoria) La mejor infografía de todos los tiempos.
  • Brian Fitzhugh An infographic that is actually interesting.
  • Leah Root Wow! This guy put more research and effort into this than most people do for research papers or companies do for financial statements. He needs to be a CEO of something. A real ‘Master of Puppets’.

Tayyip Erdoğan ve Kemal Kılıçdaroğlu’nun Twitter’da toplam yarım milyona yakın takipçisi var. Tüm bu takipçilerinin Twitter profillerini derledik ve isim istatistiklerini çıkardık. Bu sayede, “Bu takipçiler arasında ismi Ahmet olanların yüzde kaçı Erdoğan’ı yüzde kaçı Kılıçdaroğlu’nu takip ediyor?” gibi soruları cevaplayabiliyoruz. Siz de merak ettiğiniz isimlerin istatistiklerini görün diye şu siteyi hazırladık: http://liderler.cilekagaci.com/isimler (yeni pencerede açılır.)

Liderler ve Takipçileri sitesinde, takip ettikleri politik lidere göre insanların isim istatistiklerini görebilir, bu iki liderin takipçileri arasında en yaygın isimler nelermiş öğrenebilirsiniz.

Ahmet, Ali, Ayşe ve Duygu

Eğer merak ettiyseniz, en  ağırlıklı olarak Erdoğan’ı takip eden isimler arasında ilk iki sırada “Mohamed” ve “Mohammad” var. Bu iki isme sahip toplam 23 takipçi var ve bunların 23′ü de sadece Erdoğan’ı takip ediyor. Türkçede kabul gören yazılışın dışında kullanılan bu isimlerin Erdoğan’ın Arapça konuşan takipçileri yüzünden listeye girdiğini sanıyoruz. Listede daha aşağılara indikçe Ebubekir ve Ahmed gibi yine Arapça kökenli ancak Türkçe yazılışıyla kullanılan isimlere rastlıyoruz. İlk 20′ye giren ilgi çekici bir isim “Sümeyye”. Aynı zamanda Erdoğan’ın kızlarından birisinin de ismi olan Sümeyye ismine sahip 189 takipçinin 170′si Erdoğan’ı, 19′u Kılıçdaroğlu’nu takip ediyor.

Ağırlıklı olarak Kılıçdaroğlu’nu takip eden ilk iki isim ise “Sezgi” ve “Kıvılcım”. Toplam 52 tane Sezgi ve Kıvılcım’ın hepsi de Kılıçdaroğlu’nu takip ediyor. “Tilbe”, “Umay,” “İmge” gibi isimlerle devam eden listenin ilk sıraları eski Türkçe (Ortaasya Türkçesi)  veya 1930′ların dil devrimi kökenli isimlerden oluşuyor.

Sitemizde de belirttiğimiz gibi:

Bu analiz ile herhangi bir sosyal ya da siyasî mesaj verme amacımız yok. İsimlerimiz, kendi tercihimiz değil. İnsanların isimlerinden etkilenerek siyasî tercihlerini belirlediklerini de sanmıyoruz. Bununla beraber, ailelerin çocukları için tercih ettikleri isimler aynı zamanda coğrafî ve sosyo-ekonomik sinyaller içeriyor. İki liderin takipçilerinin isimleri arasında gözleyeceğimiz örüntüler bu coğrafî ve sosyo-ekonomik şartların insanların siyasî tercihleri üzerindeki etkisini anlamada yardımcı olabilir. Eğer bu örüntüler hakkında fikirleriniz varsa bunları sosyal medyada (Facebook, Twitter, interaktif sözlükler, vs.) paylaşmaktan çekinmeyin; merakla dinliyor olacağız.


Bir önceki yazımızda 2007 ve 2011 seçim sonuçlarını nasıl elde ettiğimizi anlatıp her partinin ilçe bazındaki oy oranı değişimlerini incelemiştik. Bu yazıda ise daha ilginç bir soruyu cevaplamaya çalışacağız. O da “2007′den 2011′e seçmen tercihleri ne yönde değişti?” Cevabımızı hızlıca görmek isterseniz aşağıdaki görseli inceleyebilirsiniz. Bu görseli oluşturmamızı sağlayan partiler arası oy kayması sonuçlarını nasıl elde ettiğimizi öğrenmek için ise yazımızın devamını okumanızı öneririz.


2007'den 2011'e partiler arası oy kaymaları


Şimdilik örnek basit olsun diye seçim sisteminde sadece üç parti olduğunu varsayalım, A, B ve C partileri. Bizim merak ettiğimiz değerler 2007′de A partisine oy veren seçmenlerin ne kadarının 2011′de de A partisine oy verdiği ve ne kadarının oylarını B partisine ya da C partisine kaydırdığı. Aynı soruları B ve C partileri için de sormak mümkün. Cevap aşağıdaki gibi bir oy transfer tablosu olacaktır:

A 92.5 3.5 4
B 10 60 30
C 0.1 0.9 99


İçini göstermelik değerlerle doldurduğumuz bu tabloda her satır ve sütundaki hücrenin içindeki sayı, bir önceki seçimlerde o satıra karşılık gelen partiye oy verenlerin yüzde kaçının son seçimde o sütuna karşılık gelen partiye oy verdiğini gösteriyor. Örneğin A satırının C sütunundaki değer %4 olduğuna göre bir önceki seçimlerde A partisine oy vermiş seçmenlerin %4′ü son seçimlerde C partisine oy vermiş, diyebiliriz. Bu örnek analizimizde A ve C partilerinin bir önceki seçimde kendilerine oy veren seçmen tabanını koruduklarını görüyoruz (A satırı ve A sütunu %92.5, C satırı ve C sütunu ise %99). Buna karşın B partisi kendisine daha önceden oy veren seçmenlerin büyük kısmını kaybetmiş. Bir önceki seçimlerde B partisine oy verenlerin %10′u A partisini, %30′u ise C partisini tercih etmiş.

Gelelim gerçek hayata. Elimizdeki veriye göre — kullanılmayan oyları ve bağımsızlara atılan oyları da iki ayrı partiye atılmış gibi düşünürsek — 2007′de seçimlere giren parti sayısı 16, 2011′de seçimlere giren parti sayısı ise 17. İşleri kolaylaştırmak için 2007′den sadece Adalet ve Kalkınma Partisi (AKP), Cumhuriyet ve Halk Partisi (CHP), Milliyetçi Hareket Partisi (MHP), Demokrat Parti (DP), Genç Parti (GP), Saadet Partisi (SP), bağımsızlar ve oy kullanmayanları  ele aldık, geri kalan tüm partileri diğerleri adıyla tek bir parti gibi düşündük. 2011 için ise AKP, CHP, MHP, bağımsızlar, oy kullanmayanlar ve diğerleri şeklinde 6 parti kullandık. Buna göre içini doldurmaya çalıştığımız oy transfer tablosu  sekiz satırlı ve altı sütunlu oldu.

Peki bu tablonun içini nasıl dolduracağız? Genel kabul gören yöntemlerden birisi araştırma şirketleri aracılığı ile insanlara doğrudan “2007′de hangi partiye oy vermiştiniz; 2011′de hangi partiye oy verdiniz?” diye sormak. Düzgün yürütüldüğü zaman sorunun kaynağına inip çok değerli sonuçlar üretse de, bu tür anketlerde insanların genel olarak en son kazanan partiye oy verdiğini söyleme, oyunu değiştirmiş olsa dahi değiştirmediğini söyleme, radikal partilere oy verdiğini saklama ve hatta oy vermediği halde sorulara oy vermiş gibi cevaplama eğilimleri olduğu biliniyor.

Ankete dayalı yöntemi tamamlayan, veri odaklı bir yaklaşım nasıl olurdu? Tek tek insanların tercihlerini bilmiyoruz ama ilçe bazındaki oy değişimleri bize partiler arası oy kaymaları hakkında bir fikir verebilir. Örneğin Karşıyaka’da CHP’nin oy oranı %42′den %63′e fırlarken AKP ve Genç Parti’nin toplam oy kaybının %14′ü bulması bize bir ipucu veriyor olmalı. Ya da Bolu’nun Yeniçağ ilçesinde AKP’nin oy oranı neredeyse 12 puan yükselirken (%63.41′den %75.2′ye), Saadet Partisi’nin oy oranının 8 puan birden düşmesi (%13.37′ten %5.17′ye) başka bir ipucu. Bu tür birbirine bağlı artış ve azalışların olduğu ilçelere bakarak bir fikir yürütmek mümkün.

Çoğu zaman bir ilçede iki ya da üç partinin birden oyu azalırken başka iki ya da üç partinin de oyu yükseldiği için hangi ikili arasında anlamlı bir oy transferi var anlamak zor. Bu zorluğu aşmak için matematiksel olarak biraz gelişmiş teknikler kullanmak gerekiyor. Grupların topluca yaptıkları tercihlere bakarak tek tek bireylerin tercihlerini tahmin etmeye çalışan bu yöntemlere literatürde genel olarak ekolojik çıkarım (ecologocal inference) ismi veriliyor. Biz bu analizimizde 1997′de Harvard, Pittsburgh ve Northwestern üniversitelerindeki araştırmacılar tarafından önerilen ve yakın zaman önce İtalya’da 2006-2008 seçimlerindeki oy kaymalarını inceleyen bir çalışma tarafından da kullanılan bir yöntemi tercih ettik. Bu yöntem bir önceki paragraftakine benzer çok sayıda ilçe için yapılmış gözlemlere dayanarak hangi partiden hangi partiye ne kadarlık bir oy kayması yaşandığını tahmin ediyor.

Sonuçları vermeden önce yapmamız gereken son bir uyarı, cevap aradığımız bu soruya kesin ve yanılmaz cevap veren bir yöntemin olmadığı. Ankete dayanan yöntemlerin dahi yanılabildiği bu konuda sadece ilçe bazındaki sonuçlara bakarak bireylerin tercihlerindeki değişimi tahmin etmek oldukça güç. Mesela bu yöntemle ilgili literatürde bilinen bir sıkıntı, genel olarak parti sadakatini – yani oyunu değiştirmemiş seçmen oranını – olduğundan yüksek tahmin etme eğilimi olması. Dolayısıyla verdiğimiz sonuçları kesin cevaplar olarak değil ancak anketlere dayanan sonuçlarla beraber yorumlanması gereken ve hassas oranlardan çok genel eğilimleri yansıtan sayılar olarak ele almak daha doğru olacaktır.

Gerekli tüm detayları ve uyarıları aradan çıkardığımıza göre 902 ilçe üzerinden yaptığımız analizin özetini yukarıda verdiğimiz görsel ile birlikte yeniden inceleyebilirsiniz. Analizimizin sonuçlarını aynı zamanda bir tablo olarak da veriyoruz.  Kayda değer bir oy kayması yaşamadıkları için oy kullanmayan grup ile diğer partilerin sütununu tabloda göstermiyoruz.

AKP 92.56 0.13 2.84 0.23
CHP 0.15 99.02 0.10 0.06
MHP 17.60 7.58 71.45 0.16
BAĞIMSIZ 0.00 0.00 0.00 99.63
DP 33.43 15.35 13.98 4.60
GP 8.93 84.30 0.80 0.54
SP 60.20 1.14 7.75 0.72
KULLANMAYAN 3.10 3.80 1.88 5.26
DİĞER 52.09 3.80 3.77 0.23


Tabloyu ilk satırdan başlayarak okuyalım: 2007′de AKP’ye oy verenlerin %92.56′sı yeniden AKP’ye oy vermiş. Diğer tercihler arasında %2.8 ile MHP göze çarpıyor. CHP’ye %0.1, bağımsızlara ise %0.2′lik oy kayması söz konusu. Buna göre AKP seçmeninin parti sadakatinin oldukça yüksek olduğu söylenebilir.

2007′de CHP’ye oy verenlerin %99′u 2011′de yine CHP’ye oy vermiş. Diğer partilere, sözünü etmeye değecek bir kayma yok. Bu sonuç, CHP’nin 2007′de zaten başarılı olduğu ilçelerde 2011′de daha da başarılı olduğu gözlemiyle birleşince, CHP’nin tabanında bir kayıp yaşamadığına dair daha da kesin bir kanıt oluyor.

2011′de %1.28′lik bir oy kaybı yaşayan MHP’ye 2007′de oy veren seçmenin sadece %71.4′ü yeniden oy vermiş. MHP’den ayrılan oyların adresi ise %17.6 ‘lık oran ile AKP ve %7.6′lık oran ile CHP olmuş.

Oy tabanını koruyan başka bir oluşum ise bağımsızlar. 2007′de bağımsızlara giden oyların %99.63′ünün 2011′de yine bağımsız adaylar için kullanıldığını görüyoruz.

2007′ye oranla en yüksek oy oranı kaybını yaşayan parti DP. 2007′de %5.42′lik oy oranına sahipken 2011′de %0.65 ile neredeyse sandıktan silinen bu parti 2007′de kendisine oy veren her 20 seçmenden sadece birisini korumayı başarmış. DP’den kaçan oyların diğer partilerin oy oranlarına çok ciddi etkisi olduğu açık. Burada en büyük pay %33.43 ile AKP’nin. Ancak hem CHP (%15.35) hem de MHP’nin (%13.98) DP’den ayrılan oylar için AKP’ye ciddi birer alternatif oluşturabildiğini görüyoruz. Burada not düşmemiz gereken diğer bir konu da GP ve MHP’den gelen oylar dışında CHP’nin merkez sağ olarak düşünülebilecek kesimden elde ettiği en önemli oy oranının DP tabanından gelmiş olması.

2011′deki seçimlere katılmayan Genç Parti’nin 2007′deki oy oranı %3.03′tü. Bu seçmenin 2011′deki tercihleri %8.9 ile AKP ve %84.3 ile CHP olmuş. Başka deyişe 2007′de GP’ye oy veren her yüz seçmenden 84′ü CHP’ye, 9′u ise AKP’ye yönelmiş. Sadece GP’den gelen oyların CHP’nin ülke çapında gösterdiği 5 puanlık artışın yarısını açıklayabileceğini not düşelim.

2007′de aldığı %2.34′lük oy oranı 2011′de %1.24′e düşen Saadet Partisi’ne oy veren seçmenlerin 2011 tercihlerinde en büyük pay AKP’nin: tam %60.2′lik bir oy kayması söz konusu. Dikkate değer diğer bir adres ise %7.75 ile MHP olmuş. Tercihini yine SP’den yana kullanan seçmenlerin oranı %22.4.

Şu ana kadar gördüğümüz sonuçları şöyle özetleyebiliriz:

1) AKP, 2007′de bağımsızlar ve CHP’ye oy veren seçmen hariç diğer tüm partilerden az ya da çok oy kazanmayı başarmış. Bu bir önceki analizimizde değindiğimiz gibi AKP’nin ülke genelinde hemen her ilçedeki seçmenlere hitap eden bir parti olduğuyla uyumlu bir gözlem.

2) CHP’nin çekirdek tabanını koruduğunu ve, AKP hariç,  sağ tabana sahip denebilecek diğer partilerden (Genç Parti, DP, ve MHP) seçmen kazandığını görüyoruz. Geleneksel CHP tabanı dışında olduğunu tahmin ettiğimiz bu seçmen grubu sayesinde gözlenen kıpırdanma ne ölçüde başarı sayılmalı, bu öznel bir karar. Ama değişik mecralarda dile getirilen CHP’nin tabanından uzaklaştığı iddiasının tamamen temelsiz olduğunu söyleyebiliriz. Ayrıca Genç Parti’den gelen oylar CHP’deki artışı kısmen açıklıyor ama kendi başına yeterli değil.

3) Oy oranı sadece %1.28 düşen MHP’de aslında derin suların pek durgun olmadığını, 2007′de kendisine oy veren her on seçmenden üçünü kaybettiğini ancak bu kaybı AKP, DP ve SP’den gelen yeni seçmenlerle telafi ettiğini gözledik. Tabanda yaşanan bu kaymayı sadece ülke çapındaki oy oranlarına bakarak yakalamamız mümkün değildi.

4) Bağımsızlara oy veren kitle büyük oranda değişmemiş. Ne diğer partilerden bağımsızlara ne de bağımsızlardan diğer partilere ciddi bir oy kayması gözledik.

Son olarak, ilçelerdeki seçmen sayılarındaki artışın ne kadarı iç göçten kaynaklanıyor, ne kadarı ilçelerin kendi nüfus artışından dolayı bilemediğimiz için ilk defa oy kullanan seçmenlerin tercihlerini analiz edemedik. Eğer bu soruya da anketlere ek olarak veri odaklı bir çözümünüz varsa duymak isteriz. Yorumlarınızı ve önerilerinizi merak ediyoruz.

2011 seçim sonuçlarını incelemeye devam edeceğiz. Takibi bırakmayın ve analizimizi beğendiyseniz sosyal medyada paylaşmaktan çekinmeyin.

2011 seçimlerinin ardından ilgi çeken iki konu AKP’nin üçüncü defa üstüste iktidar olurken oylarını arttırma başarısını göstermesi  ve CHP’nin oylarındaki artışın başarı sayılıp sayılmayacağı tartışmaları oldu. Bunların yanı sıra 2007 Genel Seçimleri’ne göre MHP’deki %1.28 oy kaybına karşın AKP (%3.32), CHP (%5.03) ve bağımsızların (%1.41) oylarındaki toplam artışın %9.76 olması TBMM’ye giren partilerin temsil gücü açısından olumlu bir gelişmeydi.

Biz bu ve önümüzdeki birkaç yazıda seçim sonuçlarını analiz edip anlamaya çalışacağız. Ağırlıklı olarak kullanacağımız yöntem 2011 sonuçlarını 2007 sonuçlarıyla il ve ilçe bazında karşılaştırmak olacak.

YSK’nın sayfasından 2007 seçim sonuçlarını ve Google’ın 2011 seçimleri için özel hazırladığı siteden de 2011 sonuçlarını indirdik. Bu veride her ilçenin oy dağılımı ayrı ayrı yer almakta. 2007–2011 arası kurulan yeni ilçeler olduğu için sadece her iki listede de yer alan ortak ilçeleri kullandık (ilçeler arası gerçekleşmiş olabilecek mahalle değişimlerini dikkate almıyoruz). Bu sayede 902 ilçe ve her iki seçim için o ilçedeki partilerin oy oranlarını elde ettik.

Isınma amacı taşıyan bu yazımızda – bağımsızları da bir parti olarak ele alıp – dört partinin ilçe bazında oylarının nasıl değiştiğini görselleştirdik. Aşağıdaki ilk grafikte her mavi kare bir ilçeyi temsil ediyor. Yatay eksen partinin 2007 seçimlerinde bir ilçede aldığı oy oranını, düşey eksen ise 2011 seçimlerinde aldığı oy oranını – yüzde olarak – gösteriyor. Buna göre partinin iki seçimde de aynı oy oranını elde ettiği ilçeler kesik çizgili x=y doğrusu üzerinde yer alıyor. Partinin 2007′ye göre oy oranını arttırdığı ilçeler doğrunun yukarısında, düşürdüğü ilçeler ise altında yer alıyor.



Bu grafikte ilk göze çarpan sonuç AKP’nin hem 2007 hem 2011 seçimlerinde neredeyse tüm ilçelerde hatırı sayılır oy oranı elde etmesi. Sayıya dökmek gerekirse 2011′de AKP’nin %10′un altında oy aldığı ilçe sayısı sadece sekiz (Diyarbakır-Lice;  Muş-Varto; Ardahan-Damal; Tunceli’de Hozat, Nazımiye, Ovacık ve Pülümür; Van-Başkale). 2007′de aynı sayı altıymış. Bu sonuçlara göre “AKP, Türkiye’de hemen her ilçeyi temsil eden çok geniş tabanlı bir parti olduğunu tescillemiştir.” diyebiliriz. Dikkate değer diğer bir nokta ise az önce saydığımız çok düşük oy aldığı ilçelerin haricinde AKP’nin genel olarak tüm ülke genelinde ilçe bazında oy oranlarını arttırmış olması. Bunu ilçe bulutundaki yoğun kümenin genel olarak yükselmiş olmasından anlayabiliriz.

CHP’nin grafiğini AKP’ninki ile karşılaştırdığımızda açıkça görülüyor ki CHP ülkenin tümünde varlık gösterebilen bir parti olamamış. 2011 seçimlerinde %10′un altında oy aldığı tam 230 ilçe var. Öte yandan 2007′de aynı sayının 297 olması CHP adına olumlu bir gelişmeye işaret ediyor. Örnek olarak CHP’nin 2011′de en düşük oy aldığı beş ilçe şöyle:  Şanlıurfa-Harran (%0.33), Bingöl-Genç (%0.39), Diyarbakır-Dicle (%0.55), Bitlis-Hizan (%0.58) ve Hakkari-Yüksekova (%0.69).

Ayrıca grafik bize CHP’nin 2007′de yüksek oy aldığı ilçelerde oy oranını genel olarak daha da arttırdığını gösteriyor. Örneğin İzmir-Karşıyaka’da 2007′de %42.67 olan oy oranı 2011′de %63′e fırlamış. Bu, değişik mecralarda dile getirilen CHP’nin kendi tabanından uzaklaştığı ve bu kesimlerden oy kaybettiği görüşünü zayıflatan bir gözlem. Ancak bu gözlemin ardında negatif bir nokta da var. Eğer CHP’nin 2007′de %10′un altında oy aldığı 297 ilçeye bakacak olursak, bu ilçelerin oy oranlarının medyanı (ortanca değer) 2007′de %5.72, yine aynı illerin 2011 medyanı ise %6.65. Bu artışın ne kadar az olduğunu anlatmak için geri kalan 605 ilçe için aynı değerlerin sırasıyla  20.42 ve 26.71 olduğunu belirtelim. Kısaca CHP’nin oy oranlarının artışında aslan payını zaten güçlü olduğu ilçeler almış. 2007′de çok düşük oy aldığı ilçelerdeki artışı sınırlı kalmış.

MHP’nin ülke çapında kaybettiği %1.28′lik oy oranı bu grafikte kendini ilçe bulutunun x=y doğrusunun altına düşmesiyle belli ediyor. Oy kaybının yüksek olduğu ilçeler özellikle 2007 seçimlerinde MHP’nin yüksek oy aldığı yerler. Bu partinin 2007′de %20 ya da daha az oy aldığı ilçelerde nispeten daha az oy kaybı yaşamış olması ilginç bir durum. Eğer CHP için yaptığımız gibi ilçeleri MHP’nin 2007′de %20′nin altında ve üstünde oy aldığı ilçeler olarak ikiye bölersek, birinci grubun 2007′deki medyan oy oranı %12.23 iken 2011′de sadece %11.59′a düşmüş. Buna karşın ikinci grubun, yani MHP’nin 2007′de %20′nin üstünde oy aldığı ilçelerin medyan oy oranı 2007′de %23.75 ilen 2011′de %19.95′e düşmüş. Fikir vermesi açısından MHP’nin 2007′den 2011′e oy oranı olarak en çok kayıp yaşadığı beş ilçe şöyle: Denizli-Güney (%30.25′den %12.32′ye), Adana-Karataş (%35.01′den %18.44′e), İzmir-Bayındır (%26.85′ten %11.74′e), Tunceli-Pertek (%17.25′ten %2.76′ya) ve Kırklareli-Pehlivanköy (%28.81′den %14.64′e).

Bağımsızlar için olan grafik diğer partilere göre nispeten daha az açık. Bunun bir sebebi Emek, Demokrasi ve Özgürlük Bloku’nun aday gösterdiği illerin – dolayısıyla da ilçelerin – sayısının diğer partilerden küçük olması. Yine de özellikle bağımsızların 2007′de %10′un üzerinde oy aldıkları ilçelerin çoğunda oy oranlarının çok ciddi miktarda arttığını görebiliyoruz. Oy oranlarında en çok artışın gözlendiği beş ilçe şöyle: Bitlis-Hizan (%30.64′ten %71.37′ye), Şırnak-Güçlükonak (%25.21′den %65.65′e), Mardin-Ömerli (%16.32′den %53.21′e), Van-Çatak (%27.74′ten %64′e) ve Van-Çaldıran (%24.74′ten %58.65′e).

Aşağıda aynı grafikleri daha büyük ölçekte ve oy oranında büyük değişim yaşayan bazı ilçelerin isimleri belirtilmiş olarak görebilirsiniz. Burada, AKP’nin 2007 seçimlerine göre Doğu ve Güneydoğu bölgelerindeki ilçelerde büyük oranda oy kaybettiğini görüyoruz. Göze çarpan başka bir nokta ise 2011 seçimlerinde Tunceli ilçelerinde CHP oylarında büyük artışlar, bağımsız oylarında ise neredeyse aynı oranlarda düşüşler olması. Bu veriye bakarak Tunceli’de 2011 seçimlerinde, CHP’nin, 2007′de bağımsız adaylara oy veren seçmenleri kazandığı tahmin edilebilir. Son olarak, Çayeli-Rize’deki bağımsız oylarındaki %42′ye yakın düşüşü – ve  AKP oylarındaki büyük artışı – 2007′de Rize’den aday olan Mesut Yılmaz’ın 2011 seçimlerinde yer almamasına bağlamak mümkün görünüyor.


İlk aşamadaki analizlerimiz bunlar. Kısa bir süre içinde yayınlayacağımız ikinci yazımızda ilçe bazındaki oy değişimlerinden yola çıkarak “2007′den bu yana seçmen tercihleri ne yönde değişti?” ve “Hangi parti hangi partinin oylarını çaldı?” sorularının cevaplarını arayacağız. Kaçırmamak için blogumuza RSS üzerinden abone olabilir ve yeni yazılarımızdan anında haberdar olabilirsiniz.

Partiler seçim beyannamelerinde hangi şehirlerden ne kadar sıklıkla bahsetmişler merak ediyor musunuz? Biz ettik ve beyannemeler içinde 81 ilimizin isimlerini tek tek aradık. Aşağıdaki Türkiye haritasında (Şekil A) hangi şehirden hangi partinin beyannamesinde  bahsedildiğini görebilirsiniz. (BDP’nin seçim beyannamesinde veya parti programında özel olarak şehir ismi geçmediği için sadece diğer üç partiye yer veriyoruz.)

Harita bize üç şey anlatıyor:

  • AK Parti beyannamesinde pek çok şehirden bahsetmiş ve bunu yaparken de neredeyse tüm bölgelere yer vermiş. “AKP, iktidar partisi olduğu için icraatlere daha çok yer veriyor. Bu yüzden de şehirlerden daha çok bahsediyor.” denebilir ancak eğer arama motorumuza danışacak olursanız (bkz. İzmir, Antalya) şehir isimlerinin hem vaat hem icraat bağlamında kullanıldığını görebilirsiniz. Ayrıca bu sonuçlara bakarken AK Parti’nin beyannamesinin diğer partilerinkilere göre çok daha uzun olduğunu da akılda bulundurmak gerek.
  • Üç partinin de bahsettiği şehirler İstanbul, İzmir, Ankara, Samsun, Ordu, Trabzon, ErzurumGaziantep ve Adana.
  • Batı Karadeniz ve İç Ege bölgelerindeki şehirlerden hiçbir parti bahsetmemiş. “Önümüzdeki seçimler yerel seçim olmadığı için beyannamelerde tek tek şehirlerden bahsedilmemesi normaldir.” denebilirdi ancak harita bize bu iki bölge dışında diğer tüm bölgelerden bahsedildiğini gösteriyor.

Peki şehirlerden bahsetme sıklıkları hakkında ne diyebiliriz? Bu soruyu şöyle cevapladık: Parti beyannamelerini tek tek ele alıp her şehir için beyannamede o şehirden kaç defa bahsedildiğini saydık ve bu sayıyı o şehrin nüfusuna böldük. Bu sayede partilerin bir şehirden nüfusa kayıtlı birey başına ortalama kaç defa bahsettiğini gösteren dengeli bir sonuç elde ettik. Aşağıdaki – Şekil B – üç haritada sırasıyla AK Parti, CHP ve MHP’nin hangi şehirden ne kadar sıklıkla bahsettiğini görebilirsiniz. Açık gri renk, bir şehirden hiç bahsedilmediğini gösteriyor. Renk ne kadar koyuysa o şehirden nüfusa oranla o kadar sık bahsedilmiş demek.



Dikkatimizi çeken noktalar şunlar:

  • AK Parti nispeten dengeli bir şekilde Türkiye’nin her köşesindeki şehirlerden bahsetmiş. Ağırlık Doğu Anadolu ve Doğu Karadeniz’de ancak batıda parlayan üç şehir var, onlar da İzmirUşak ve Çanakkale.
  • CHP Ankara’nın batısındaki şehirlerden İzmir ve İstanbul hariç hiç bahsetmemiş. Bahsettiği şehirler içinde ağırlık Güney Doğu Anadolu ve Doğu Anadolu’da.
  • MHP genel olarak İç Anadolu’daki şehirlerden bahsetmeyi tercih etmiş.

Eğer ilginizi çekerse hangi şehir hangi partinin beyannamesinde kaç defa kullanılmış aşağıdaki tablodan inceleyebilirsiniz. Eğer şehirlerin hangi bağlamda kullanıldığını görmek isterseniz politik arama motorumuzu kullanabilirsiniz.



Akşam Gazetesinin 25 Nisan 2011 tarihli bir haberinde şöyle bir paragraf var:

Metropoll Genel Müdürü Prof. Dr. Özer Sencar, Türkiye geneli düşünüldüğünde aday veya seçim beyannamelerin çok fazla etkili olduğunu düşünmediğini belirterek, ‘Seçmeni liderlerin söylemleri ve inandırıcılıkları etkiler. Yoksa partilerin beyannamesini halkın yüzde 1′i dahi açıp okumaz’ dedi.

Özer Sencar’ın seçmenlerin beyannameleri okumadığı yönündeki tahminini biz de paylaşıyoruz. Ancak bu durum tespiti, asla seçmenlerin ilgisiz olduğu anlamına gelmiyor. Eğer seçim beyannamelerinde cümle sonlarına dair analizimizi okuduysanız bu tür dokümanların ne kadar uzun olduğunu biliyorsunuz demektir. İnsanların bu dokümanları indirip ayrıntılı olarak okumalarını, bununla da kalmayıp ilgi duydukları konularda tüm partilerin neler dediğini karşılaştırmalı olarak incelemelerini beklemek çok gerçekçi değil.

İşte tam olarak bu sebeple, seçmenlerin parti beyannamelerini baştan sona okumak zorunda kalmadan inceleyebileceği, farklı partilerin aynı konuda neler dediklerini karşılaştırabileceği bir arama motoru hazırladık ve ismini de Politik Arama Motoru koyduk. Linke tıklayın, anahtar kelimeleri girin (mesela nükleer enerji, seçim barajı, Avrupa Birliği, vs.) ve partilerin bu konularda söyleyecek neleri varmış yan yana görün. Eğer politika konusunda tartışmayı seviyorsanız ilginç bulduğunuz, beğendiğiniz sonuçları sosyal medya ortamlarında tanıdıklarınızla paylaşabilirsiniz de.


Politik Arama Motoru


Politik Arama Motoru’nun seçmenlerin bilgiye erişimini kolaylaştıracağını ve bu sayede onların daha bilinçli karar vermelerine yardımcı olacağını ümit ediyoruz. Bu tür sitelerin aynı zamanda kolektif bir bellek oluşturarak partilerin hesap verebilirlik konusunda kendilerini geliştirmelerine vesile olacağını düşünüyoruz. 2015 yılında yapılması beklenen gelecek seçimlerde Politik Arama Motoru’nu tekrar ziyaret ettiğinizi ve iktidar partisinin hangi sözlerini tutup hangilerini tutmadığını kolayca gördüğünüzü düşünün.

Biz halkın yüzde birinden daha fazlasının bu ülke yönetiminde bilinçli bir şekilde söz sahibi olmak istediğine inanıyoruz. Tek gereken, onlara bilgiye erişmeleri ve bunu başkaları ile paylaşmaları için gerekli araçları sunmak. Eğer bu düşüncemizi paylaşıyorsanız bize yardım edin: Politik Arama Motoru’nu tanıdıklarınızla paylaşın.


(Güncelleme: Eğer bu analizde kullandığımiz seçim beyannamelerinde kendi aramalarınızı yapmak isterseniz politik arama motorunu kullanabilirsiniz: http://politik.cilekagaci.com/)

Çilek Ağacı ekibi olarak yürüttüğümüz projenin yeni çıktılarını sunuyoruz sizlere. Yaptığımız şu: Partilerin seçim beyannamelerindeki (BDP’nin beyannamesine ulaşamadığımız için parti programındaki) cümleleri türlerine göre grupluyoruz ve hangi gruptan daha çok var sayıyoruz. Dört adet grup tanımladık:

  • Geçmiş. Geçmişe göndermede bulunan cümleler. Ör. “Türkiye’de siyasete müdahaleler darbe dönemleriyle sınırlı kalmayarak, olağan dönemlerde de sürdürülen bir gelenek haline getirilmiştir.” ya da “Bilişim teknolojisini yargının hizmetine sunduk.
  • Tespit. Mevcut durumu bildiren cümleler. Ör. “Bu tablo, yargının verdiği tüm kararları tartışmalı hale getirmekte ve toplumsal barışa zarar vermektedir.
  • Vaat. Gelecekle ilgili yargıda bulunan cümleler. Ör. “Sivil toplum kuruluşlarının yönetime daha aktif katılımı ile temsili demokrasinin katılımcı demokrasiye doğru gelişmesi sağlanacaktır.
  • Diğer. Sıraladığımız grupların hiçbirine girmeyen cümleler.

İlk grafikte farkedebileceğiniz gibi neredeyse tüm kategoriler için AK Parti’nin cümle sayısı daha fazla çünkü AK Parti’nin seçim beyannamesi içlerindeki en uzunu (3462 cümle; diğer parti dokümanlarının uzunlukları CHP için 1533, MHP için 1256 ve BDP için 689 cümle). Eğer doküman uzunluğunu denklemden çıkarıp cümle türlerinin her partinin kendi içindeki dağılımına bakarsak ikinci grafiği elde ediyoruz.


Seçim Beyannamelerinde Cümle Analizi


Her şeyden önce, beyannamesinde icraatlarına bol bol yer veren AKP’nin mevcut iktidar partisi olduğunu anlamak kolay. Geçmişe fazlaca göndermede bulunan bir diğer parti ise BDP; fakat bunu bambaşka gerekçeler ile yaptıklarını tahmin etmek zor değil (“1990′lardan itibaren bazı maddelerde kısmi düzenlemeler yapılmışsa da anayasanın darbeci özüne dokunulmadığından, tekçi-otoriter-vesayetçi sistem değişmemiştir.“).

CHP, vaat sıralama yarışını diğerlerinden bir adım farkla önde tamamlamış. Onu AKP ve MHP izliyor. Bununla beraber, MHP ile CHP neredeyse tıpa tıp uyan bir dağılım sergiliyorlar: Belki de bu dağılım ana muhalefet bloğunun bir karakteristiğidir. Önceki seçimlerin beyannamelerini inceleyerek bu iddiayı sınamak mümkün.

Elimizdeki veriyle yapılabilecek en basit analizlerden biri buydu. Daha ilginç şeyler için biraz zaman istiyoruz.

Geçtiğimiz hafta çoğu parti 2011 seçim bildirgelerini yayınladı ve biz de bunların üzerinde çalışmaya başladık bile. Sonuçlar gelene kadar AK Parti, CHP, MHP ve BDP’nin parti programlarını kullanarak oluşturduğumuz sözcük bulutlarını paylaşıyoruz.

Aşağıdaki görseli oluşturmak için dört partinin de programını baştan sonra inceledik ve kelime köklerinin frekanslarını hesapladık. Ardından her parti için ayrı ayrı diğer üç partiye göre en ayırt edici (sık) şekilde kullanılan kelimeleri kullandık. Örneğin CHP’nin çok sık kullanıp diğer üç partinin o kadar sık kullanmadığı kelimeler arasında “ulusal” ve “CHP” yer alıyor. Beklenen bazı kelimeler dışında (BDP için “bölge”, MHP için “milli”, “milliyet”, vs.) bazı ilginç sonuçlar da var: AK Parti’nin en ayırt edici kelimeleri arasında “yapmak“, “kurmak” ve “yönetmek” olması parti söylemi hakkında bir fikir veriyor olmalı.

Parti programları önümüzdeki seçimi düşündüğümüzde eskide kalmış metinler. Yakında seçim beyannamelerine dayanan analizlerimizi de paylaşacağız. Partilerin siyasal metinlerindeki söylemin hangi yönde değiştiğine bakmak ilginç olabilir.