App Store A/B Testing: What to Test First
A practical guide to A/B testing on the App Store and Google Play. Learn which elements have the most impact and how to run valid experiments.
App Store sayfaniza dunyanin butun trafigini yonlendirebilirsiniz, ancak gorsel varliklariniz ziyaretcileri indirmeye donusturmuyorsa bu trafik bosa gider. App Store A/B testi, listeleme ogelerinizin farkli versiyonlarini karsilastirarak hedef kitlenizde en cok hangi versiyonun yanki uyandirdigini bulmaya yarayan sistematik bir surecttir. Kanitlanmis etkisine ragmen, gelistiricilerin cogu hicbir test yapmaz.
Bu kilavuz, neyi test edeceginizi, nasil test edeceginizi ve hangi sirada test edeceginizi kapsar. Hem iOS hem de Google Play uzerinde gecerli deneyler yurutmenin mekanigini ve test yol haritanizi onceliklendirmek icin pratik bir cerceve ogreneceksiniz.
ASO'da A/B Testi Neden Az Kullaniliyor?
ASO toplulugu A/B testini sik sik konusur, ancak benimseme orani dusuk kalir. SplitMetrics'in 2024 anketine gore, uygulama gelistiricilerinin yalnizca %23'u son 12 ayda bir magaza listeleme testi yapmistir.
%23
gelistiriciler listelemelerini test ediyor
SplitMetrics, 2024
10.950
tek bir testten yillik ekstra yuklemeler
gunluk 10 bin gosterimde
$21.900
esdeger ucretli reklam degeri
$2 eCPI ile
Dusuk benimseme oraninin nedenleri tahmin edilebilir:
- Algilanan karmasiklik: Bircogu gelistirici, testin pahali araclar veya yuksek trafik hacimleri gerektirdigini varsayar. Gercekte Apple, Custom Product Pages ve Product Page Optimization araciligiyla yerlesik test imkani sunar; Google Play ise yerel Store Listing Experiments ozelligine sahiptir.
- Tasarim darboğazi: Alternatif varliklar (simgeler, ekran goruntuleri, videolar) olusturmak, kucuk ekiplerin kolayca erisemeyebilecegi tasarim kaynaklari gerektirir.
- "Yeterince iyi" dusuncesi: Bir uygulama buyurken ekipler donusum optimizasyonu yerine ozelliklere odaklanir. Firsat maliyeti gorünmezdir cunku elde edemediginiz indirmeleri asla goremezsiniz.
Basit bir testin arkasindaki matematik
Gunluk 10.000 gosterim x %4 tiklama orani x %30 yukleme orani = günlük 120 yükleme.
Bir simge testi tiklama oranini %4'ten %5'e yukseltir = günlük 150 yükleme, %25 artis. Bir yilda: 10.950 ekstra yukleme. $2 eCPI ile = $21.900 esdeger ucretli reklam degeri.
iOS ve Google Play Test Secenekleri
Iki buyuk platform farkli test olanakları sunar. Her birinin yerel olarak neleri destekledigini anlamak onemlidir.
Platform test yetenekleri
| Ozellik | iOS (PPO/CPP) | Google Play |
|---|---|---|
| Simge testi | Evet (PPO) | Evet |
| Ekran goruntusu testi | Evet (PPO) | Evet |
| Video testi | Evet (PPO) | Evet |
| Aciklama testi | Hayir | Evet (kisa + uzun) |
| Yerellestirilmis testler | Hayir | Evet |
| Maks. varyant sayisi | 3 alternatif | Esnek |
| Istatistiksel anlamlilik hesabi | Manuel | Yerlesik |
| Ozel acilis sayfalari | Evet (35 CPP'ye kadar) | Hayir |
Apple App Store
Apple, 2021'de Product Page Optimization (PPO) ve onunla birlikte Custom Product Pages (CPP) ozelligini tanitti. Bunlar iki farkli aractir:
- Product Page Optimization (PPO): Gercek bir A/B test aracidir. Urun sayfaniz icin her biri farkli simge, ekran goruntusu veya uygulama onizlemesi iceren en fazla 3 alternatif "varyant" olusturursunuz. Apple, organik trafigi orijinaliniz ile varyantlar arasinda rastgele boler. Testler en az 7 gun surer.
- Custom Product Pages (CPP): Geleneksel bir A/B testi degildir, ancak segmentasyon icin gucludur. Her biri benzersiz ekran goruntuleri, onizleme videolari ve tanitim metni iceren en fazla 35 alternatif urun sayfasi olusturabilirsiniz. Bu sayfalar, Search Ads kampanyalari veya harici pazarlama icin benzersiz URL'ler alir.
iOS kisitlamasi
PPO, uygulama adi, alt baslik veya aciklamayi test etmenize izin vermez; yalnizca gorsel ogeleri test edebilirsiniz. Metadata testi icin ardisik test kullanin: bir guncellemede metadatayi degistirin, etkisini olcun, onceki donemle karsilastirin.
Google Play Store
Google, Play Console'da dogrudan Store Listing Experiments sunar. Bu testler Apple'in PPO'sundan daha esnektir:
- Uygulama simgesini, ozellik grafiğini, ekran goruntulerini, kisa aciklamayi ve uzun aciklamayi test edebilirsiniz.
- Testler belirli yerellestirilmeleri hedefleyebilir, boylece farkli pazarlarda ayni anda farkli deneyler yurutebilirsiniz.
- Google, bir sonucun ne zaman guvenilir oldugunu bilmeniz icin istatistiksel anlamlilik hesaplamalari saglar.
Google Play testi iOS'tan daha esnektir. Her iki platformda da yayinliyorsaniz, Google Play'de agresif testler yapin ve ogrenilenleri yonlendirici olarak iOS'a uygulayin.
Etki Hiyerarsisi: Hangi Ogeler En Cok Fark Yaratir
Tum listeleme ogeleri donusum uzerinde esit etkiye sahip degildir. SplitMetrics ve StoreMaven tarafindan binlerce testten derlenen verilere dayanarak, en yuksekten en dusuge etki hiyerarsisi sunlardir:
Bu hiyerarsi test yol haritanizi yonlendirmelidir. En buyuk farklari yaratan ogelerle baslayin: simgeniz ve ilk ekran goruntulerıniz.
Uygulama Simgenizi Test Etme
Simge, uygulamanizin yuzudur. Kullanicilar onu arama sonuclarinda, urun sayfasinda, ana ekranlarinda ve bildirimlerde gorur. Iyi tasarlanmis bir simge, uygulamanizin kategorisini ve kalitesini saniyelerin kesri icinde iletir.
Neleri test etmeli
- Renk paleti: Sicak ve soguk, tek renk ve degrade, yuksek kontrast ve yumusak. Veriler, App Store'un beyaz arka planina karsi yuksek kontrastli simgelerin daha fazla tiklama aldigini gosteriyor. Mavi ve yesil simgeler verimlilik ve saglik kategorilerinde fazla temsil ediliyor, bu nedenle one cikmak beklenmedik bir renk kullanmak anlamina gelebilir.
- Grafik stili: Duz tasarim ve 3D, soyut sembol ve gercekci illustrasyon, karakter ve nesne. Stil, kategoriniz icin kullanici beklentileriyle uyumlu olmalidir.
- Karmasiklik: Basit simgeler (1-2 oge) ve detayli simgeler (3 veya daha fazla oge). Kucuk boyutlarda (arama sonuclari kucuk resmi yaklasik 60x60 nokta), basit simgeler hizli ayristirilabilir olduklari icin daha iyi performans gosterme egilimindedir.
- Simgede metin: Metin kucuk boyutlarda okunamaz hale geldigi icin genellikle onerilmez. Ancak marka adi olan uygulamalar icin tek bir kelime veya harf ise yarayabilir.
Minimum test gereksinimleri
Simge testlerini en az 14 gun boyunca calistirin. Apple, varyant basina minimum 2.000 gosterim onerir, ancak daha kucuk donusum farklarini guvenilir sekilde tespit etmek icin 5.000+ gosterimi hedefleyin.
Test varyantlarını tasarlamadan önce mevcut listelemenizi ve kreatif varlıklarınızı BoostYourApp'in Magaza Listesi görünümünde inceleyerek taban çizginizi anlayın.
Ekran Goruntusu Optimizasyonu ve Testi
Ekran goruntuleri, listelemenizin satis sunumudur. Uygulamanizin degerini iletmeleri gerekir, yalnizca arayuzunu gostermek yetmez. En etkili App Store ekran goruntuleri bir kalip izler: bir faydayi belirten kalin baslik metni ile uygulamanin kullanim halini gosteren bir cihaz cercevesi.
Test edilecek temel degiskenler
- Baslik mesaji: Ozellik odakli ("50'den fazla egzersizi takip edin") ve fayda odakli ("Gunde 15 dakikada formda kalin") ve sosyal kanit ("2 milyondan fazla sporcu tarafindan kullaniliyor"). Fayda odakli basliklar genellikle ozellik odakli basliklardan %10 ila %20 daha iyi performans gosterir.
- Ekran goruntusu sirasi: Ilk hangi ekrani gosteriyorsunuz? Ilk ekran goruntusu, uygulamanizin ne yaptigini ve birinin neden ilgilenmesi gerektigini hemen iletmelidir.
- Gorsel stil: Acik arka plan ve koyu arka plan, renkli degradeler ve temiz beyaz, cihaz cerceveleri ile ve cercevesiz.
- Ekran goruntusu sayisi: Apple en fazla 10 ekran goruntusu kullanimina izin verir. 10'unun hepsini kullanmaniz gerekmez, ancak ilk 3'u kritiktir.
- Panoramik ve bireysel: Kaydirirken iki kareye yayilan gorseller etkilesimi artirabilir, ancak bu kaliba asina olmayan kullanicilari karistirabilir.
Ekran goruntusu test protokolu
Faz 1
Baslik mesajini test edin
Gorsel tasarimi sabit tutun, yalnizca ilk 2 ekran goruntunuzdeki basliklari degistirin. Bu, mesajlasmanin etkisini izole eder.
Faz 2
Gorsel stili test edin
Kazanan mesaj belirlendikten sonra, basliklari sabit tutarken farkli arka planlar, renkler veya duzenlerle varyantlar olusturun.
Faz 3
Ekran goruntusu sirasini test edin
Kazanan ekran goruntulerini alin ve hangi siralanmanin en iyi donusum yaptigini gormek icin farkli dizilisleri deneyin.
iOS'ta Custom Product Pages
Custom Product Pages (CPP), iOS ASO araclari arasinda en guclu ve en az kullanilan ogelerden biridir. Organik trafigi bolen PPO'nun aksine, CPP'ler size belirli pazarlama kanallarına veya Search Ads anahtar kelime gruplarina atayacaginiz benzersiz URL'ler verir.
Stratejik kullanim alanlari
- Anahtar kelimeye ozel acilis sayfalari: En iyi 3 ila 5 anahtar kelime temaniz icin birer CPP olusturun. Birisi "butce planlayicisi" aradiginda planlama ozelliklerini vurgulayan ekran goruntulerini gosterin. Apple Search Ads, CPP'leri belirli anahtar kelime gruplarina atamaniza olanak tanir.
- Kanala ozel sayfalar: Sosyal medya trafigi, influencer kampanyalari ve web yonlendirmeleri icin farkli CPP'ler olusturun. TikTok reklamasindan gelen bir kullanicinin beklentileri, Google aramasindan gelen birinden farklidir.
- Sezonluk promosyonlar: Tatil kampanyalari, okula donus donemleri veya yeni yil fitness atilimlari icin CPP'ler olusturun. Varsayilan sayfaniza dokunmadan hedeflenen CPP URL'sini degistirin.
- Ozellik lansmanlari: Buyuk bir yeni ozellik yayinladiginizda, organik trafik icin varsayilan sayfayi sabit tutarken duyuru kampanyaniz icin onu vurgulayan bir CPP olusturun.
Her CPP'nin performansini App Store Connect analitikleri araciligiyla takip edin. Farkli sayfalar arasinda donusum oranlarini, indirme hacimlerini ve kullanici tutma oranlarini karsilastirin.
Gecerli Testler Tasarlama
Guvenilir olmayan sonuclar ureten bir test, hic test yapmamaktan daha kotudur, cunku size yanlis bir guven verir. Gecerli magaza listesi deneylerinin ilkeleri sunlardir.
Orneklem boyutu gereksinimleri (%30 temel yukleme orani)
| Tespit Edilebilir Iyilestirme | Varyant Basina Gosterim | Gunluk 1 bin gosterimde gun sayisi |
|---|---|---|
| %20 goreceli (%30 → %36) | ~1.600 | ~7 gun |
| %10 goreceli (%30 → %33) | ~6.400 | ~13 gun |
| %5 goreceli (%30 → %31,5) | ~25.000 | ~50 gun |
Uygulamaniz gunde 1.000 gosterim aliyorsa ve 2 varyantli bir test (orijinal arti bir alternatif) calistiriyorsaniz, her varyant gunluk 500 gosterim alir. Test suresini buna gore planlayin.
Asla 7 gunden kisa test yapmayin
App Store trafigi haftanin gunune gore degisir. Yalnizca hafta ici verilerini yakalayan bir test, hafta sonu davranis kaliplarini kacirır. Minimum: 14 gun (iki tam haftalik dongü).
Ayni anda tek degisken
Deneylerin altin kurali: ayni anda yalnizca bir seyi degistirin. Simgenizi ve ilk ekran goruntunuzu ayni anda degistirirseniz ve donusum artarsa, iyilesmeyi hangi degisikligin sagladigini bilemezsiniz. Once simgeyi test edin, kazanani uygulayin, sonra ekran goruntulerini ayri test edin.
Istisna, tamamen farkli iki gorsel yonu karsilastirmak istediginiz kapsamli bir yaratici revizyonu yaptiginiz zamandir. Bu durumda, bunu butunsel bir test olarak ele alin ve bireysel ogeleri izole etmek yerine "yon A ve yon B" testini yaptiginizi kabul edin.
Dis faktorler
Test sonuclarinizi kirletebiıecek olaylara dikkat edin: sezonluk trafik degisiklikleri, ayni anda yurutulen pazarlama kampanyalari, uygulama guncellemeleri, kategori siralama degisiklikleri veya rakip eylemleri. Test penceresi suresince onemli bir sey olursa, testi uzatin veya yeniden baslan.
Sonuclari Dogru Okuma
Testiniz sona erdiginde, daha yuksek donusum oranina sahip varyanti secme durtusune karsi koyun. Su analitik ilkeleri uygulayin:
Istatistiksel anlamlilik
Bir sonuc, rastgele sans ile gozlemleme olasiliginin esik degerinizin altinda oldugunda (tipik olarak %5 veya %95 guven duzeyi) istatistiksel olarak anlamlidir. Google Play anlamliligi deney sonuclarinda gosterir. Apple PPO icin kendiniz hesaplamaniz veya cevrimici bir anlamlilik hesaplayicisi kullanmaniz gerekebilir.
Testiniz %3'luk bir iyilesme gosteriyor ancak istatistiksel olarak anlamli degilse, varyantin gercekten daha iyi oldugu sonucuna varamazsiniz. Gurultu olabilir. Ya daha fazla veri toplamak icin testi uzatin ya da farkin guvenilir bir sekilde olculemeyecek kadar kucuk oldugunu kabul edin.
Sonuclari segmentlere ayirin
Mumkunse sonuclari trafik kaynagina (organik arama, gozatma, yonlendirme) ve pazara gore ayri ayri inceleyin. Genel olarak kazanan bir varyant, belirli segmentlerde kaybedebilir.
Alt metrikıeri dikkate alin
Donusum orani (gosterimden yuklemeye) magaza listesi testleri icin birincil metriktir, ancak tek onemli metrik degildir. Bir varyant daha fazla indirme cekiyor ama bu kullanicilar iyi tutulmuyor veya odeme yapmiyorıarsa, "kazanan" varyant aslinda geliri dusrebilir.
Yuklemelerde kazanan ancak kullanici tutma veya gelirde kaybeden bir varyant gercek bir kazanan degildir. Mumkun oldugunda alt metrikleri takip edin.
Ceyreklik Test Yol Haritasi Olusturma
Sporadik testler sporadik sonuclar uretir. En basarili uygulamalar yapilandirilmis bir test takvimi izler:
Ay 1
Simge ve ilk izlenim
2-3 simge varyanti tasarlayin (1-2. haftalar). 14+ gun PPO testi calistirin (2-4. haftalar). Analiz edin ve kazanani uygulayin.
Ay 2
Ekran goruntusu mesajlari ve sirasi
Farkli baslik acilarindan 2-3 alternatif ekran goruntusu seti olusturun (1-2. haftalar). PPO testi calistirin (2-4. haftalar). Kazanani uygulayin.
Ay 3
Ileri duzey optimizasyon
En iyi 3 anahtar kelime temasi icin Custom Product Pages olusturun (1-2. haftalar). CPP'leri Search Ads'de baslatn (2-3. haftalar). Ceyreklik sonuclari inceleyin ve sonraki ceyiregi planlayin.
Testler arasinda surdurulen calismalar
Resmi PPO testleri arasında, Magaza Listesi verilerinizi kullanarak dönüşüm trendlerini izleyin. Listelemenizde herhangi bir değişiklik yapmadan dönüşüm oranında ani bir düşüş fark ederseniz, dış faktörleri araştırın: yeni bir rakip, mevsimsel değişim veya Apple arama sonuçları düzenindeki bir değişiklik.
BoostYourApp'in Metadata Editoru aracını kullanarak meta veri değişikliklerinizin sürüm geçmişini test sonuçlarıyla birlikte tutun. Bu, belirli değişiklikleri performans sonuçlarıyla ilişkilendirmeyi kolaylaştırır.
Kumulatif Etkiyi Olcme
Bireysel testler mutevazi kazanimlar uretebilir. Burada %5 iyilesme, surada %10 iyilesme. Ancak bu kazanimlar bilesik olarak buyur.
Disiplinli testin bilesik etkisi
Tiklama orani %15 iyilesir (simge testi) x yukleme orani %12 iyilesir (ekran goruntusu testi) = toplam yüklemelerde %29 artış ayni trafikten. Dort ceyreklik disiplinli testin ardindan bircok uygulama organik dönüşüm oranlarını ikiye katlar.
Anahtar, tutarliliktir. Ayda en az bir test calistirmaya karar verin. Net bir kazanan uretmeyen testler bile degerli ogretiler saglar - o ogenin zaten iyi optimize edildigini ve kaynaklarinizin baska yerde daha iyi harcanacagini soylerler.
App Store A/B testi tek bir sihirli mermi bulmakla ilgili degildir. Listelemenizin her ogesindeki dusuk performansi sistematik olarak ortadan kaldirmakla ilgilidir. Simgenizle baslayin. Ekran goruntulerıne gecin. Custom Product Pages'i katmanlayin. Her seyi test gunlugunuzde takip edin.
A/B testi tek seferlik bir olay degildir - bilesik kazanimlarin sistematik bir surecidir. Ayda bir test, tutarli bir sekilde uygulandiginda, listelemenizi iki ceyrek icinde donusturur.
Listelemenizin şu anda nasıl performans gösterdiğini görmek ister misiniz? Magaza Listenizi Inceleyin ve bir sonraki metadata guncellemenizi planlayin BoostYourApp ile.
BoostYourApp Team
ASO & Analytics
Blogdan daha fazlası
App Store Keyword Optimization: A Complete Guide
Your app's keyword field is only 100 characters. Every character counts. Here is how to make them work harder for you.
ASO Competitor Analysis: How to Find Keywords Your Rivals Miss
The fastest way to improve your App Store rankings is to learn from apps already ranking above you.