Minggu, 10 April 2011

Analisis dari Web - Bab 4


Belajar sifat-sifat dari Web sebagai objek formal menyediakan cukup banyak pengaruh untuk desainer dari sistembaru, dan badan standar yang tugasnya adalah menemukan dan menjaga variasi dari pengalaman Web padaskala besarPada bagian ini kita akan meninjau secara singkat upaya untuk mendeskripsikan topologi web.


4.1              Topologi Web
4.1.1        Struktur Web
Investigasi topologi dilakukan untuk  memahami bentuk dasar dari arsitektur dan relasi diantara keduanya. Struktur dapat memberi kita banyak informasi. Penyelidikan struktur dari web selalu tergantung dari level pemisahan dari pendeskripsian struktur web. Seperti contohnya saja ukuran web yang mungkin memiliki perbedaan sangat kecil dalam kinerja dari komponennya mampu memberikan perbedaan besar di level makro.

Pemahaman struktur sangat penting untuk sejumlah aplikasi, seperti navigasipencarian, menyediakan sumber daya untuk mendukung komunitas online, atau efek dari perubahan mendadak dalam permintaan informasi.

Topologi Web berisi kompleksitas dari rantai linear sederhanaPada bagian inikita akan membahas upaya untukmengukur struktur global dari Webdan bagaimana halaman web individu dapat masuk ke dalam konteks itu.

4.1.2        Penelitian teoritis graph
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah teori grafikWeb dapat dilihat sebagaigrafik yang besar pada tengah halaman dan bagian tepinya adalah linkKarena weblinks sangat sedikitberantakanjelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang bagi mereka adalah sama pentingnya.

Konektivitas webgraph telah dianalisis secara rincimenggunakan struktural seperti indikator seperti bagaimananode yang terhubungBerbagai makro struktur scopic telah dilihat dan diukur, misalnya satu merangkak dari lebihdari 200 juta halaman menemukan bahwa 90dari Web sebenarnya tersambung. Struktur berikutnya seringdisebut sebagai bentuk bowtie, seperti yang ditunjukkan pada Gambar di bawah. Simpul dasi sangat berhubungancluster (SCC) dari webgraph di mana terdapat jalur antara setiap pasangan nodeSCC ini diapit oleh dua setclustermereka yang dihubungkan (link) ke SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam gambar), dan mereka yang terkait dari SCC tetapi tidak link kembali (OUT). Hubungan antara SCCIN dan OUTmemberikan bentuk bowtieImplikasi dari penemuan ini masih topologi perlu dipahamiMeskipun beberapa telahmengusulkan perubahan terhadap algoritma PageRank untuk mengambil keuntungan dari topologi dasar, masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur terlihat.

  



Struktur bowtie lazim di berbagai skalaDill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki bentuk bowtiesebuah petunjuk bahwa Web mempunyai sifat fractal yang menarik karakteristiksebagai Web pada umumnya.

Memangpertanyaan skala dipotong dua arahAda yang lain, lebih kecil dari Web sekitardan web itu sendiridatang sebagai sesuatu dari kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai, sekarangstudi Web cenderung melihat WebStruktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda,dalam hal ukuran, konektivitaskoherensi dan pencarian sifatbeberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidakTelah ada sedikit pekerjaan atas struktur kontrasmeskipun melihat untuk investigasi Intranetdan subgraphs sesuai dengan topik scientific tertentu . Web cukup jarang tersambung,berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosongtetapi jika kita mencarikelompok non-acak (cluster tematis-bersatu atau TUCsyang jauh lebih dihubungkanmaka kita melihat bentukbowtie muncul lagiSetiap TUC akan memiliki SCC sendiridan sendiri IN dan OUT sisi, termuat di dalam SCCyang lebih luasSCC skala yang lebih besarkarena sangat berhubungankemudian dapat bertindak sebagaitulang punggung navigasi antara TUCs.

4.2              Matematik dalam Web
Opez L 'Ortiz, dalam surveinya, terlihat di sejumlah paradigma berguna untuk memahami dasar-dasar algoritmikInternet pada umumnya dan Web pada khususnyaMenerapkan wawasan tentang algoritma masalah jaringan,dalam konteks protokol tertentu mendasari Webberpotensi sangat bermanfaat. Pertumbuhan dari WebsepertiOpez L ‘Ortiz tunjukkan, adalah yang paling canggih dari teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995namun berjuang keras pada akhirtahun itu.

4.2.1        Model rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikromathemat diskrit
icsteori pilihan rasional dan teori permainanMeskipun pengguna individu mungkin atau mungkin tidak "rasional",itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitasDalam hal ini,pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkanperilakudan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasadan apa yangbisa system mendukung perilaku tersebut.



Jika, seperti dalam Gambar di ataskurva penawaran adalah elastis sempurna (misalnya horizontal), ada tigakesetimbangandua titik di mana suplai persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan titik di mana kurva penawaran hits sumbu y (= 0). Jika jaringan ukuran tetap pada 0maka permintaan tetap nihil,dan kami tinggal di posisi A. Pada Cposisi ini juga stabiljaringan berisi semua customers siap untuk membayartarif pasardan tidak bisa tumbuh karena ada tidak ada orang lain siap untuk membayarJika jaringan tumbuhitu harus karena harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawahjika menyusut jaringanyang harus karena seseorang telah mengubah preferensi dan sekarang tidak lagi siap untuk membayar harga pasar(yaitu kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua kurva tetap diammaka setiap perubahan akan mengakibatkan slip kembali ke C. Kuncinya adalah Byang meskipun suatu kesetimbangan tidak stabilJika ukuran jaringan tergelincir di bawah Bmaka tidak cukup banyak orang akan siap untuk membayartingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke nolJika di sisi lain bisa mendapatkandari Bmaka tiba-tiba banyak lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar ataulebihdan ukuran jaringan akan meningkat secara dramatismendapatkan lebih dari punuk kurva permintaan danmencapai C. Jadi B adalah massa kritis untuk jaringan.

4.2.2        Model Pencarian Keterangan
Sebuah paradigma penting kedua adalah bahwa pencarian informasiIR adalah fokus untuk perlombaan senjataantara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar danlebih kompleksdan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu ataukompleksitas dari query).

Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuknugget akalmasalah khas adalah kompleksitas dan kurangnya polaBenchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi ilmiah makalah dalam jurnal khususWeb-lain seperti mini-struktur yang dapat digunakanseperti Intranetjuga ditandaidengan itikad baik dengan informasi yang disajikanNamun upaya berbahaya untuk menumbangkan sangat IRsistem yang theWeb dukungan baik yang semakin umumIR berbasis web harus menghadapi tidak hanya skaladan kompleksitas informasitetapi upaya potensi untuk condong hasilnya dengan konten dimaksudkan  ntukmenyesatkan.

4.2.3        Struktur Berbasis Pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untukmembuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, danmereka yang tidakhanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur linksubgraphs lokalJuga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lainmasukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

Search engine juga harus berjuang untuk tetap saat inioleh Mengindeks ulang sesering mungkinkonsistendengan menekan biayasebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubahSearch engine dapat dibandingkan dengan menggunakan berbagai parameter,baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai olehmesin pencari), relevansi dari halaman kembaliwaktu diambilatau kualitas kembaliSebagai salah satuharapkanmesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

4.2.4        Metode Matematika untuk Menggambarkan Struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalamanWeb dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWebYang penting properti yangmemiliki Web adalah ketahanan dalam menghadapi pengaruh underminingbaik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalamempat puluh turun di setiap saat satuASI Barab dan kolega advokasi.

Di sisi lainteori perkolasi menunjukkan bahwa skala bebas karya agak lebih rentan terhadap terarahseranganterkoordinasibahkan jika mereka tahan terhadap kegagalan acakNon-acak kegagalan bisa merusak jika merekamenargetkan situs yang sangat terhubung, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acaklain), dan kegagalan dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmentasi.

4.2.5        Metode Matematika untuk Menggambarkan Layanan
Sebagai Web berkembang untuk memasukkan model layanandi mana perangkat lunak agen dan layanan Webakan hidup online dan dipanggil oleh penggunadan di mana metafora yang semakin penting adalah bahwa klienmenghubungi penyedia layananrepresentasi matematika baruformalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.

Ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebutAda hidup perdebatan tentang jala Petri danπ-kalkulus, berfokus pada manfaat relatif darijaring negara berbasis grafisdan semakin tekstuallinieraljabarevent.

kalau mau donwload PPT NYA kk dan OM-OM

http://www.ziddu.com/download/14551446/AnalisisdariWeb.ppt.html

Tidak ada komentar:

Posting Komentar