pSEO’da İstatistiksel Anlamlılık: Hangi Sayfa Sayısında Sonuç Çıkmaya Başlar?
Sorunun Kendisi Yanlış Kurulmuş Olabilir
“Kaç sayfada sonuç görmeye başlarım” sorusu, aslında SEO dünyasının A/B testi kültüründen ödünç alınmış bir çerçeve. Bu çerçeveyi anlamak için önce nereden geldiğine bakmak gerekiyor.
Klasik istatistiksel anlamlılık SEO’da nasıl çalışıyor
A/B testlerinde gerçekten bir örneklem büyüklüğü hesabı var: bir t testi çalıştırırsın, p değerine bakarsın, %95 güven aralığını geçip geçmediğini görürsün.
Nitekim SEO testleri üzerine yapılan bir analizde, bir içerik değişikliğinin tıklama oranını gerçekten artırıp artırmadığını anlamak için 42 günlük öncesi-sonrası veri karşılaştırılmış ve p değeri %0,00135 çıkarak değişikliğin %99,99 güvenle gerçek olduğu sonucuna varılmış.
Bu, klasik istatistiksel anlamlılığın SEO’da nasıl çalıştığının iyi bir örneği ölçülebilir, tekrarlanabilir, matematiksel olarak savunulabilir bir sonuç.
pSEO neden bu modele uymuyor
pSEO bu modele uymuyor, çünkü temel varsayım burada çöküyor. Çünkü pSEO’da ürettiğin yüzlerce ya da binlerce sayfa, birbirinden bağımsız rastgele örnekler değil her biri ayrı bir arama sorgusuna, ayrı bir rakip grubuna, ayrı bir niyet seviyesine giriyor.
“İstanbul ofis taşıma fiyatları” sayfası ile “İzmir web tasarım paketleri” sayfası, istatistiksel popülasyon açısından aynı dağılımdan gelen iki örnek değil; her biri kendi pazarında, kendi rakipleriyle, kendi arama hacmiyle ayrı bir mücadele veriyor.
Bu yüzden “500 sayfa yayınladım, istatistiksel olarak anlamlı” demek, aslında “500 farklı küçük yarışmaya aynı anda girdim” demekle aynı şey değil. Akademik anlamda doğrulanmış, evrensel bir eşik sayısı yok; olan şey, sektörün tekrar tekrar gözlemlediği davranışsal eşikler.
Bu yazı boyunca verilen sayılar da bu nedenle birer kesinlik iddiası değil, tekrar eden vaka çalışmalarından damıtılmış pratik referans noktaları olarak okunmalı.
Önce Neyin “Sayılmaması” Gerektiğini Anlamak Gerekiyor
Sayı konuşmadan önce, hangi sayfaların sayıma bile girmemesi gerektiğini netleştirmek lazım. Çünkü pSEO’da başarısızlığın en büyük nedeni, sayfa sayısının yetersizliği değil, sayfa kalitesinin baştan dağılmış olması.
Çalışan bir pSEO sayfasının iki şartı
Sektör analizleri, çalışan bir pSEO sayfasının iki kriteri aynı anda karşılaması gerektiğini gösteriyor: sayfa başına en az 500 benzersiz kelime, ve şablon taslağına göre en az %30-40 oranında içerik farklılaşması. İlk kriter nicel, ikincisi ise daha incelikli ve çoğu zaman gözden kaçırılan kriter.
Bu ikinci kriter özellikle kritik, çünkü pSEO’nun en yaygın hatası tam burada oluyor: “İstanbul’da SEO ajansı” sayfasıyla “Ankara’da SEO ajansı” sayfası arasındaki tek fark şehir adıysa, bu teknik olarak iki farklı sayfa değil, aynı sayfanın iki kopyasıdır ve Google bunu öyle görür.
Şablon mantığı doğru kurulmuş gibi görünse de, altındaki veri zenginliği yoksa ortaya çıkan şey otomatikleştirilmiş tekrar oluyor, otomatikleştirilmiş değer değil.
Bedeli ağır ödenen iki vaka
Bu durumun somut bedelini gösteren bir vaka var: Datanyze şirketi, /companies ve /people alt klasörlerindeki programatik sayfalarında trafiğin %96’sını kaybetti.
Bu kayıp izole bir alt klasörle sınırlı kaldı yani sorun sitenin genelinde değil, tam olarak düşük farklılaşmalı şablonun uygulandığı bölgede yoğunlaştı.
Bu da otomasyonun seçici şekilde cezalandırıldığını gösteriyor; Google sitenin tamamını değil, kalitesiz üretimin yapıldığı spesifik bölgeyi hedef alıyor.
Daha çarpıcı bir örnek de “SEO heist” olarak anılan bir olay 1.800 makalelik bir AI içerik yığını yayınlandıktan sonra trafik %99,52 oranında çöktü.
Bu iki örnek de yüksek sayfa adedinin, düşük kaliteyle birleştiğinde nasıl tam tersi bir sonuç ürettiğini gösteriyor. Yani soruyu “kaç sayfa” diye sormadan önce “kaç sayfa gerçekten birbirinden farklı” diye sormak gerekiyor.
Programatik SEO Hatalarının Kök Nedenleri Bunu Doğruluyor
Üç kök neden
Başarısız pSEO programlarının neden başarısız olduğuna dair yapılan bir analiz, dokuz farklı yaygın hatayı üç ana kök nedene indirgiyor: yetersiz veri, bozuk teknik altyapı (kanonik hataları, hatalı iç linkleme) ve yayın sonrası geri bildirim döngüsünün olmaması.
Bu üçlü sınıflandırma önemli, çünkü sektörde sık karıştırılan iki farklı sorunu birbirinden ayırıyor: bir tarafta “içerik yetersizliği”, diğer tarafta “teknik altyapı yetersizliği” var, ve bunların çözümü tamamen farklı.
“İnce içerik bir veri seti problemidir, şablon problemi değil”
Bu analizde özellikle vurgulanan bir nokta var: ince içerik sorunu her zaman bir veri seti problemidir, asla bir şablon problemi değil.
Yani sorun “şablonu nasıl yazdığın” değil, “şablona ne besleyebildiğin” elinde gerçekten 500 farklı şehir için 500 farklı, anlamlı veri noktası (fiyat, yorum, istatistik, görsel) yoksa, kaç sayfa yayınlarsan yayınla sonuç aynı yere çıkıyor.
Bu, sektörde sıkça yapılan bir yatırım hatasını da açıklıyor: birçok ekip aylarca şablon tasarımına, sayfa düzenine, başlık formatlarına emek harcıyor, ama altına koyacak özgün veri setini hiç inşa etmiyor. Oysa doğru sıralama tam tersi önce veri zenginliği, sonra şablon.
Aşamalı Eşikler: Pilot, Doğrulama, Ölçek
Bu çerçeveyi kabul ettikten sonra, sektörde tekrar eden üç aşamalı bir yapı görülüyor. Bunlar matematiksel olarak kanıtlanmış sınırlar değil, tekrarlanan vaka çalışmalarından damıtılmış pratik aralıklar. Her aşamanın kendi amacı, kendi başarı ölçütü ve kendi riski var.
Pilot aşaması (50-100 sayfa)
Pilot aşaması genellikle 50 ile 100 sayfa arasında kalıyor. Bu aşamanın amacı trafik almak değil, şablonun Google tarafından nasıl karşılandığını gözlemlemek. İndeksleniyor mu, ne kadar sürede indeksleniyor, kanonik etiketleme doğru çalışıyor mu, sayfa hızı sorunu çıkıyor mu bunlar bu aşamada cevaplanması gereken sorular.
Bir SEO uygulayıcısının paylaştığı somut bir örnek bu ölçeği gösteriyor: SEOmatic gibi bir araçla üretilen 75 sayfalık bir pilot, araştırma ve yayın süresini normalde 12 saat sürecek bir işten 3 saate indirmiş.
Ama bu süre tasarrufu, sonucun sıralama getireceği anlamına gelmiyor sadece üretim hızını kanıtlıyor, sonucu kanıtlamıyor. Pilot aşamasında “hız” ile “başarı”yı birbirine karıştırmak, bu aşamadaki en yaygın yanılgı.
Teknik açıdan da pilot aşaması rahat bir bölge: crawl budget (Google’ın bir siteyi taramaya ayırdığı kapasite) konusu, sitenin toplam URL sayısı birkaç bini geçmediği sürece gerçek bir kısıt oluşturmuyor.
Bir kaynağa göre, crawl budget yönetimi 10.000 sayfanın üzerinde dikkat gerektiren bir konu haline geliyor, 100.000 sayfanın üzerinde ise kritik öncelik kazanıyor; 10.000 sayfanın altında temel hijyen yeterli, enerji başka yere ayrılmalı. Yani 50-100 sayfalık bir pilotta crawl budget hiç gündeme gelmiyor bu aşamada sorun varsa, neden büyük ihtimalle teknik kapasite değil, içerik kalitesi.
Doğrulama aşaması (birkaç yüz sayfa)
Doğrulama aşaması birkaç yüz sayfaya çıkıyor. Burada artık tek tek sayfaların performansı değil, şablon varyasyonları arası karşılaştırma önemli hale geliyor: hangi veri türü (fiyat odaklı mı, yorum odaklı mı, karşılaştırma odaklı mı) gerçekten indeksleniyor ve sıralanıyor?
Sektör rehberleri bu aşamada sayfaları sistematik bir rubrikle puanlamayı öneriyor potansiyel arama hacmi, ölçeklenebilirlik (bu desenden kaç sayfa daha üretilebilir) ve rekabet avantajı (elindeki özel veri SERP’te gerçek bir fark yaratıyor mu) gibi kriterlerle.
Bu puanlamayı geçemeyen şablon, büyütülmeden elenir çünkü 300 sayfada çalışmayan bir desen, 3.000 sayfada da çalışmaz, sadece üç bin kat daha fazla risk taşır.
Bu aşamada bir teknik faktör daha devreye giriyor: iç linkleme mimarisi. Büyük ölçekli site analizleri, web sayfalarının yaklaşık dörtte birinin hiç iç link almadığını ve büyük sitelerde sayfaların yarısından azının yeterli iç link aldığını gösteriyor.
Doğrulama aşamasında bu mimariyi düzgün kurmazsan, ölçek aşamasına geçtiğinde ürettiğin binlerce sayfanın önemli bir kısmı “öksüz sayfa” (orphan page) olarak kalır yani Google tarafından keşfedilemez hale gelir, sayı ne kadar büyük olursa olsun.
Ölçek aşaması (binler)
Ölçek aşaması ise asıl sayıların konuşulduğu yer. Burada iki uç örnek sektörde sürekli referans gösteriliyor.
Canva’nın renk paleti sayfaları mütevazı ama istikrarlı bir model sunuyor: 1.900 sayfa, ayda 83.000 ziyaret, yani sayfa başına ortalama 44 ziyaret.
Bu rakam küçük görünebilir ama düşük rekabetli, yüksek niyetli bir kuyruğu istikrarlı şekilde besliyor ve bu tür bir performans, “az ama derin” bir pSEO stratejisinin de tutarlı sonuç verebileceğini gösteriyor.
Diğer uçta Zapier var 800.000’in üzerinde indekslenmiş sayfayla ayda 16,2 milyon organik ziyaretçi üretiyor. Ama bu noktaya bir gecede gelinmedi; yıllar süren şablon iyileştirmesi, iç linkleme optimizasyonu ve veri zenginleştirmesinin birikimli sonucu bu.
Bu ölçekte crawl budget artık merkezi bir mesele haline geliyor bir teknik kaynak, crawl budget optimizasyonunun büyük sitelerde içerik ya da link çalışmasının asla başaramayacağı sıralama iyileştirmelerini ortaya çıkarabilecek “yukarı akış” (upstream) bir problem olduğunu belirtiyor.
Yani Zapier ölçeğindeki bir site için artık soru “kaç sayfa yayınladım” değil, “Google’ın bu sayfaların kaçını gerçekten tarayıp işleyebildiği.”
Asıl Belirleyici Değişken: Sayı Değil, Zaman
Buraya kadar anlatılanların hepsinden daha önemli bir nokta var, ve çoğu pSEO tartışmasında atlanıyor: sonucun ortaya çıkıp çıkmayacağını belirleyen şey sayfa sayısından çok, o sayfaların zaman içinde nasıl bir seyir izlediği.
16 aylık eğri ve “ölüm vadisi”
Ahrefs’in 16 aylık bir takip çalışması bunu çok net gösteriyor. AI destekli üretilen makaleler ilk ayda %70,95 gibi yüksek bir oranda indeksleniyor yani Google başta bu sayfaları görüyor ve kabul ediyor gibi görünüyor.
Ama üçüncü aya gelindiğinde, ilk 100 sırada kalan sayfa oranı %3’e çöküyor. Bu düşüş, sektörde “ölüm vadisi” olarak adlandırılan ikinci ve altıncı aylar arasındaki dönemde gerçekleşiyor. Ancak hikaye burada bitmiyor: 16. aya gelindiğinde bu oran %20’ye kadar toparlanıyor.
Yani eğri düz bir çizgi değil, önce yükselen, sonra sert düşen, sonra kısmen toparlanan bir eğri. Bunun pratik anlamı şu: 50 ya da 100 sayfalık bir pilotu yayınladıktan sonra ikinci ayda “hiçbir şey olmuyor” diye paniklemek, eğrinin tam olarak en düşük noktasında durup yargıya varmak demek olabilir.
Asıl anlamlı ölçüm, ilk ay değil, üçüncü aydan sonraki seyir ve hatta tam resim için 12-16 aylık bir pencere gerekiyor.
2025’in deindeksasyon sinyali
Bu noktada ayrıca daha geniş ölçekli bir risk de var. Mayıs 2025 sonunda izlenen URL’lerin %25’i Google’ın indeksinden aktif olarak çıkarıldı bu, kayıtlara geçen en yüksek aktif deindeksasyon oranı olarak raporlandı.
Bu rakam, büyük hacimli pSEO denemelerinde “ne kadar çok sayfa yayınlarsam o kadar güvendeyim” mantığının artık geçerli olmadığını gösteriyor. Google’ın kalite eşiği yükseldikçe, düşük farklılaşmalı büyük hacimler önceye göre çok daha kırılgan hale geliyor.
Bu iki veri noktasını yan yana koyduğunda ortaya çıkan tablo şu: pSEO artık “yayınla ve unut” bir taktik değil, sürekli izlenmesi gereken bir sistem. İlk indekslenme bir başlangıç sinyali, bir başarı kanıtı değil.
Sayı Yerine Oran: 70/30 Kuralı
Neden mutlak sayı yerine oran
Sektördeki en deneyimli uygulayıcıların ortak noktası, mutlak bir sayfa sayısı hedefi koymak yerine bir kaynak dağılımı oranı belirlemek.
En sık görülen model, yayınlanan içeriğin yaklaşık %70-80’inin uzun kuyruklu, veri temelli, programatik sayfalara; kalan %20-30’unun ise otorite ve güven inşa eden, elle yazılmış rehber ve araştırma içeriğine ayrılması.
Bu oranın mantığı şu: pSEO hacim sağlar ama otorite üretmez; uzun biçimli içerik otorite üretir ama hacim sağlamaz. İkisi birbirini besliyor pSEO sayfalarının sıralanabilmesi büyük ölçüde domain’in genel otoritesine bağlı, ve o otoriteyi büyük oranda elle yazılan içerik kuruyor. Bu nedenle “kaç sayfa yayınlamalıyım” sorusunun cevabı aslında “ne kadar otorite biriktirdiğime bağlı” sorusuna dönüşüyor ve otorite, sayfa sayısıyla değil, oranla büyüyor.
Pixenon İçin Pratik Çıkarım
Tüm bunları bir araya getirdiğinde, sayfa sayısını bir hedef değil, bir test büyüklüğü olarak ele almak en gerçekçi yaklaşım.
Önce 50-100 sayfalık bir pilot grupla şablonun indekslenme ve sıralanma davranışı gözlemlenir bu aşamada hiçbir trafik beklentisi olmamalı, sadece teknik sinyaller izlenmeli.
Doğrulanan şablon birkaç yüz sayfaya çıkarılır ve üçüncü ay sonrası seyrine bakılarak hangi alt segmentlerin (hangi şehir, hangi hizmet kombinasyonu) gerçekten tutunduğu belirlenir.
Bu aşamada iç linkleme mimarisi titizlikle kurulmalı; aksi halde ölçek aşamasında üretilen sayfaların önemli bir kısmı keşfedilemez kalır.
Ancak bu noktadan sonra, tutunan desenler binlere ölçeklenir ve bu büyütme sırasında içerik hacminin yaklaşık dörtte üçü programatik sayfalara, kalanı ise Kenan Ayvataş’ın kurucu otoritesini ve Pixenon’un vaka çalışmalarını taşıyan elle yazılmış içeriklere ayrılır.
Ölçek büyüdükçe, sayfa sayısından çok, üçüncü ay sonrası tutunma oranı ve deindeksasyon riski izlenmesi gereken asıl göstergeler haline gelir.
